서버에 업로드된 파일 관리하기

서버에 업로드된 파일 관리하기

나는 기능 중 하나가 파일을 업로드하는 기능인 인트라넷 웹 사이트를 호스팅하는 서버를 가지고 있습니다. 파일은 접근이 제한된 폴더에 저장되며 웹 백엔드를 통해 관리됩니다. 이름 충돌을 피하기 위해 UUID를 할당하고 향후 검색을 위해 UUID와 함께 원본 파일 이름을 데이터베이스에 저장할 계획입니다.

그러나 두 가지 우려 사항이 있습니다.

  1. 파일이 중복될 가능성(이름뿐만 아니라 실제 바이트 수준에서)
  2. 파일 무결성 보장.

어떤 유형의 해시/체크섬(MD5, SHA256 등)을 실행하면 두 가지 문제를 모두 해결할 수 있다고 생각했습니다. 해시를 저장하고 나중에 파일을 비교하여 파일이 손상되지 않았는지 확인할 수 있으며, 동일한 해시가 있는 다른 파일을 찾으면 해당 파일이 실제 복제본인지 알 수 있습니다.

그래서 내 질문은 다음과 같습니다

  1. 파일 손상에 대한 나의 우려는 근거가 없습니까?
  2. 또한 이것이 중복 파일을 식별하는 좋은 전략인가요?

답변1

1) 파일 손상은 흔한 일이 아니며 기본 시스템은 이러한 일을 예방하고 경고해야 하지만 예, 다시 확인하는 것이 좋습니다. 더 나은 방법은 오프사이트에 백업을 두는 것입니다.http://en.wikipedia.org/wiki/Comparison_of_backup_software

2) 어쨌든 해시를 사용하는 경우 다른 전략이 필요하지 않지만 예, 모든 파일을 크기별로 비교하는 rsync 이동 감지와 같은 생각이 있습니다. 이는 훌륭하고 빠르며 아직 그렇지 않은 경우 동일한 크기가 해시되고 확인됩니다. 독창성. 파일 내용에 따라 텍스트용 git 또는 미디어용 품질 우선과 같은 다른 옵션이 있습니다.

관련 정보