나는 주로 Word, Excel, OpenOffice 및 PDF 문서와 같은 많은 양의 데이터가 포함된 Samba 기반 파일 서버를 가지고 있습니다.
저는 파일 경로 + mtime을 사용하는 간단한 웹 기반 검색 인터페이스(Apache, PHP, mlocate)를 설정했습니다. 그것은 효과가 있지만 Apache Solr로 모든 문서를 색인화하는 것이 좋을 것입니다. 모든 계정에서 이것은 엄청나게 빠르며 이러한 모든 다양한 문서 유형에 대처할 수 있기 때문입니다.
하지만 웹사이트가 아닌 파일 서버이므로 모든 파일을 크롤링하고 업데이트된 파일을 계속 크롤링하고 다시 인덱싱할 수 있는 무언가가 필요합니다. 사람들은 문서를 "POST"하는 것이 아니라 단지 저장만 누르고 있을 뿐입니다.
이 작업을 수행하는 프로젝트가 있나요?
답변1
확인해 보세요inotify.파일 시스템 이벤트에 대해 즉시 알려줍니다.
답변2
이것이 질문자가 원하는 것인지 확실하지 않지만 위치를 찾을 수 있는 웹 인터페이스를 찾는 다른 사람들은 다음을 살펴보십시오.