Copia de seguridad ZFS con unidades rotativas fuera de línea

Copia de seguridad ZFS con unidades rotativas fuera de línea

Actualmente estoy en el proceso de configurar un NAS doméstico decente. La principal preocupación es la integridad de los datos y por eso decidí usar ZFS como sistema de archivos. Desafortunadamente, esto impone algunos requisitos (o recomendaciones para ser más precisos) al hardware que lo convierten en una solución bastante costosa. Esto me prohíbe implementar una copia de seguridad externa en un sistema similar y, por lo tanto, estoy buscando una solución alternativa.

Lo ideal sería tener tres discos duros extraíbles, uno de los cuales estaría cerca del servidor y se conectaría aproximadamente semanalmente. Los demás permanecerán fuera del sitio y serán rotados de vez en cuando. Soy consciente de que esto supone un riesgo para los datos nuevos, pero planeo realizar una copia de seguridad de una forma alternativa.

La pregunta es qué debo poner en las unidades extraíbles. Inicialmente pensé en poner un zpoola cada uno y usarlos zpool sendy zpool recvactualizarlos, comoaquí. Sin embargo, creo que es muy posible que las unidades estén "dañadas" una vez que necesite volver a realizar la copia de seguridad y me gustaría que ZFS se encargara de ello. Lo ideal sería que las tres unidades extraíbles estuvieran en una configuración reflejada hace hasta dos intercambios de unidades, lo que permitirá a ZFS usarlas todas para solucionar problemas en los datos antiguos al restaurar la copia de seguridad. Sin embargo, las unidades nunca se conectarán al mismo tiempo, por lo que es posible que esto no sea posible. ¿ZFS proporciona un medio para implementar lo que busco o debería utilizar un método diferente?

Respuesta1

Desafortunadamente, esto impone algunos requisitos (o recomendaciones para ser más precisos) al hardware que lo convierten en una solución bastante costosa. Esto me prohíbe implementar una copia de seguridad externa en un sistema similar y, por lo tanto, estoy buscando una solución alternativa.

No conozco exactamente sus necesidades de hardware y rendimiento, pero tenga en cuenta que los sistemas decentes pueden ser bastante baratos si sabe lo que está buscando y puede aceptar algunas pequeñas desventajas. Específicamente:

  • La cantidad de RAM necesaria que se encuentra en línea es enormemente exagerada, porque la RAM es barata en comparación con docenas de discos y la RAM es fundamental para el rendimiento (ya que se utiliza para ARC y deduplicación). Si solo necesita saturar un enlace Ethernet de 1 Gbps (~110 MB/s) y tiene principalmente una carga de trabajo de transmisión (lo que significa que se accede constantemente al disco en lugar de a la RAM), de 4 a 8 GB de memoria son suficientes (incluso 2 GB podrían funcionar) .
  • Los discos empresariales con 7200 rpm, conectores SAS, bajo recuento de errores y rendimiento de 200 MB/s son buenos, pero tampoco son realmente necesarios. Dos humildes unidades de consumo de 5200 rpm pueden saturar su Ethernet sin problemas. Las lecturas aleatorias serán más lentas, pero tampoco tienes cientos de clientes que quieran acceder a diferentes archivos cada segundo.
  • Un HBA de LSI con 8 puertos SAS es una opción confiable, pero puede resultar costoso. La mayoría de los puertos SATA de hardware en las placas de servidor son de Intel y también bastante confiables. También consumen menos energía. Nuevamente, la velocidad no importa aquí, ya que no tiene SSD ni utiliza rutas múltiples ni extensores.
  • La potencia de la CPU casi no tiene sentido, todas las CPU de servidor actuales tienen mucha potencia. Algunos Celerons de doble núcleo en el rango de 30€ también admiten memoria ECC, aparte de eso, puedes usar SoC Atom de bajo consumo o dualcores o quadcores de bajo consumo de AMD. Estas placas también suelen tener 6 puertos SATA y un PCIe para una ampliación posterior, así como soporte para 16 a 64 GB de memoria, por unos 300 euros incluyendo CPU, memoria y fuente de alimentación.
  • Aparte de eso, existen algunas ofertas de servidores SoHo de grandes empresas como Dell o HP, donde puedes conseguir un servidor completo por 300€ (economías de escala), incluyendo caja, disco y garantía. Las opciones de expansión son limitadas, pero de 4 a 6 discos siguen siendo suficientes.
  • Por último, si vive en un lugar donde la energía es barata, puede buscar hardware empresarial usado. Esos sistemas son rápidos, duraderos y baratos, pero también ruidosos y consumen mucha energía. Hay que calcular si la compensación vale la pena.

Sin embargo, creo que es muy posible que las unidades estén "dañadas" una vez que necesite volver a realizar la copia de seguridad y me gustaría que ZFS se encargara de ello. Lo ideal sería que las tres unidades extraíbles estuvieran en una configuración reflejada hace hasta dos intercambios de unidades, lo que permitirá a ZFS usarlas todas para solucionar problemas en los datos antiguos al restaurar la copia de seguridad.

En mi opinión, es muy poco probable que su sistema activo con al menos un espejo bidireccional y tres discos externos falle al mismo tiempo. Si una de las copias de seguridad aún se puede utilizar, solo habrá perdido los datos de una semana, lo cual es mucho menos grave (y puede mitigarse, por ejemplo, mediante una copia de seguridad diferencial en línea de solo los archivos recién modificados).

Pero suponiendo que esto suceda, comparemos todas las configuraciones de respaldo posibles (cada vez suponiendo que su sistema en vivo tiene 2 discos como espejos y los 5 discos son del mismo tamaño):

3 discos independientes, envío/recepción se utiliza para sincronizar datos en 3 grupos

  • Los discos no pueden corregir errores de bits, pero pueden detectarlos y usted puede restaurar archivos de los otros discos.
  • Como son independientes, puedes guardarlos en tres ubicaciones y tener 3 copias de seguridad diferentes (en relación con errores del usuario, errores de software)
  • El manejo es simple, ya que cada disco/pool se trata de la misma manera.

3 discos como espejos, envío/recepción se utiliza para sincronizar datos con 1 grupo

  • Esencialmente un sistema fuera de línea completo con muy buena resiliencia.
  • Por otro lado tienes todos los huevos en una sola canasta (robo/incendio)

3 discos como espejos degradados como se describe en la pregunta vinculada

  • Vea la respuesta vinculada para conocer las ventajas y desventajas
  • También tienes una sola versión.

Entonces, en resumen: depende de qué es más crítico para sus necesidades: múltiples puntos independientes en el tiempo o uno solo que sea más resistente contra fallas.

Si opta por la segunda solución, asegúrese de habilitar también instantáneas de datos periódicas para protegerse contra cosas como malware de cifrado (que se mitigaría en cierta medida si tuviera varios discos). Además, asegúrese de distribuir los tres discos y guardarlos en diferentes lugares para protegerlos contra incendios, robos o pérdidas.

información relacionada