Según Microsoft, Microsoft Windows Server 2019 todavía no admite la búsqueda de Windows en volúmenes habilitados para la deduplicación de datos (fuente):
Windows Search no admite la deduplicación de datos. La deduplicación de datos utiliza puntos de análisis que Windows Search no puede indexar, por lo que Windows Search omite todos los archivos deduplicados y los excluye del índice. Como resultado, los resultados de la búsqueda pueden estar incompletos para los volúmenes deduplicados.Vote por este artículo para Windows Server vNext en Windows Server Storage UserVoice.
Este ha sido un problema/desafío desde hace mucho tiempo (ejemplo).
Mantengo un servidor de archivos de Windows Server 2019, que almacena sus datos en un volumen ReFS habilitado para deduplicación de datos y también me enfrento al problema de proporcionar una funcionalidad de búsqueda que funcione.
Antes de implementar una solución mediante el uso de un motor de búsqueda de terceros, me gustaría saber si ya existen soluciones alternativas para que Windows Search funcione en volúmenes habilitados para la deduplicación de datos mediante el uso de herramientas integradas.
Entonces, si alguien conoce una solución alternativa válida, agradecería cualquier información sobre una forma de implementarla sin utilizar software de terceros.
Respuesta1
Dos opciones:
Se excluyen de la deduplicación los archivos que tienen contenido de texto completo, como pdf, doc, docx, xls, xlsx, htm, html, etc. A menudo, esos no son archivos muy grandes. Al menos en nuestra oficina, donde los archivos grandes son Photoshop y CAD. Entonces, la desduplicación ocurre con los archivos grandes, busca el texto que contiene los archivos.
Creas un .vhdx, lo montas y tienes tus archivos allí. "Dentro" del vhdx NTFS y busque, "fuera" del vhdx está en un ReFS con dedup. Funciona muy bien. Es como un servidor de archivos como Hyper-V VM, solo que sin la VM. El montaje de vhdx se puede realizar con una tarea de Windows al inicio usando diskpart con un script diskpart.