Sistema de archivos de almacenamiento distribuido: ¿cuál? ¿Existe un producto listo para usar?

Question 1

Creo que tendrás que abandonar el requisito POSIX, muy pocos sistemas lo implementan; de hecho, ni siquiera NFS realmente lo hace (piense en bloqueos, etc.) y eso no tiene redundancia.

Cualquier sistema que utilice replicación sincrónica será tremendamente lento; cualquier sistema que tenga replicación asincrónica (o "consistencia eventual") violará las reglas POSIX y no se comportará como un sistema de archivos "convencional".

Answer

Creo que tendrás que abandonar el requisito POSIX, muy pocos sistemas lo implementan; de hecho, ni siquiera NFS realmente lo hace (piense en bloqueos, etc.) y eso no tiene redundancia.

Cualquier sistema que utilice replicación sincrónica será tremendamente lento; cualquier sistema que tenga replicación asincrónica (o "consistencia eventual") violará las reglas POSIX y no se comportará como un sistema de archivos "convencional".

Question 2

No puedo hablar con el resto, pero parece estar confundido entre un "motor de almacenamiento distribuido" y un "sistema de archivos distribuido". No son lo mismo, no deben confundirse con la misma cosa y nunca serán lo mismo. Un sistema de archivos es una forma de realizar un seguimiento de dónde se encuentran las cosas en un disco duro. Un motor de almacenamiento como hadoop es una forma de realizar un seguimiento de una cantidad de datos identificados por una clave. Conceptualmente no hay mucha diferencia. El problema es que un sistema de archivos es una dependencia de un motor de almacenamiento... después de todo, necesita una forma de escribir en un dispositivo de bloque, ¿no?

Aparte de todo eso, yopoderHable sobre el uso de ocfs2 como un sistema de archivos distribuido en un entorno de producción. Si no desea conocer detalles importantes, deje de leer después de esta línea: es genial, pero puede significar más tiempo de inactividad del que cree.

Hemos estado ejecutando ocfs2 en un entorno de producción durante los últimos años. Está bien, pero no es excelente para muchas aplicaciones. Realmente debería analizar sus requisitos y descubrir cuáles son; es posible que descubra que tiene mucha más libertad para fallas de lo que pensaba.

Como ejemplo, ocfs2 tiene un diario para cada máquina del clúster que montará la partición. Entonces, digamos que tiene cuatro máquinas web y cuando crea esa partición usando mkfs.ocfs2, especifica que habrá seis máquinas en total para tener espacio para crecer. Cada uno de esos diarios ocupa espacio, lo que reduce la cantidad de datos que puede almacenar en los discos. Ahora, digamos que necesita escalar a siete máquinas. En esa situación, necesitas eliminar elcompletocluster (es decir, desmontar todas las particiones ocfs2) y usar la utilidad tunefs.ocfs2 para crear un diario adicional, siempre que haya espacio disponible. Entonces, y sólo entonces, podrá agregar la séptima máquina al clúster (lo que requiere que distribuya un archivo de texto al resto del clúster a menos que esté usando una utilidad), recuperar todo y luego montar la partición en las siete. máquinas.

¿Ves lo que quiero decir? Se supone que es alta disponibilidad, lo que se supone que significa "siempre en línea", pero ahí mismo tienes un montón de tiempo de inactividad... y Dios no quiera que estés lleno de espacio en el disco. NO quieres ver lo que sucede cuando llenas a ocfs2.

Tenga en cuenta que evms, que solía ser la forma "preferida" de administrar clústeres ocfs2, ha seguido el camino del pájaro dodo en favor de clvmd y lvm2. (Y adiós a los evms). Además, heartbeat se convertirá rápidamente en un proyecto zombie a favor de la pila openais/pacemaker. (Aparte: al realizar la configuración inicial del clúster para ocfs2, puede especificar 'pcmk' como motor del clúster en lugar de latido. No, esto no está documentado).

Por si sirve de algo, hemos vuelto a nfs administrado por pacemaker, porque los pocos segundos de tiempo de inactividad o algunos paquetes tcp descartados cuando pacemaker migra un recurso compartido de nfs a otra máquina es trivial en comparación con la cantidad de tiempo de inactividad que estábamos viendo para básico Operaciones de almacenamiento compartido como agregar máquinas cuando se usa ocfs2.

Answer

No puedo hablar con el resto, pero parece estar confundido entre un "motor de almacenamiento distribuido" y un "sistema de archivos distribuido". No son lo mismo, no deben confundirse con la misma cosa y nunca serán lo mismo. Un sistema de archivos es una forma de realizar un seguimiento de dónde se encuentran las cosas en un disco duro. Un motor de almacenamiento como hadoop es una forma de realizar un seguimiento de una cantidad de datos identificados por una clave. Conceptualmente no hay mucha diferencia. El problema es que un sistema de archivos es una dependencia de un motor de almacenamiento... después de todo, necesita una forma de escribir en un dispositivo de bloque, ¿no?

Aparte de todo eso, yopoderHable sobre el uso de ocfs2 como un sistema de archivos distribuido en un entorno de producción. Si no desea conocer detalles importantes, deje de leer después de esta línea: es genial, pero puede significar más tiempo de inactividad del que cree.

Hemos estado ejecutando ocfs2 en un entorno de producción durante los últimos años. Está bien, pero no es excelente para muchas aplicaciones. Realmente debería analizar sus requisitos y descubrir cuáles son; es posible que descubra que tiene mucha más libertad para fallas de lo que pensaba.

Como ejemplo, ocfs2 tiene un diario para cada máquina del clúster que montará la partición. Entonces, digamos que tiene cuatro máquinas web y cuando crea esa partición usando mkfs.ocfs2, especifica que habrá seis máquinas en total para tener espacio para crecer. Cada uno de esos diarios ocupa espacio, lo que reduce la cantidad de datos que puede almacenar en los discos. Ahora, digamos que necesita escalar a siete máquinas. En esa situación, necesitas eliminar elcompletocluster (es decir, desmontar todas las particiones ocfs2) y usar la utilidad tunefs.ocfs2 para crear un diario adicional, siempre que haya espacio disponible. Entonces, y sólo entonces, podrá agregar la séptima máquina al clúster (lo que requiere que distribuya un archivo de texto al resto del clúster a menos que esté usando una utilidad), recuperar todo y luego montar la partición en las siete. máquinas.

¿Ves lo que quiero decir? Se supone que es alta disponibilidad, lo que se supone que significa "siempre en línea", pero ahí mismo tienes un montón de tiempo de inactividad... y Dios no quiera que estés lleno de espacio en el disco. NO quieres ver lo que sucede cuando llenas a ocfs2.

Tenga en cuenta que evms, que solía ser la forma "preferida" de administrar clústeres ocfs2, ha seguido el camino del pájaro dodo en favor de clvmd y lvm2. (Y adiós a los evms). Además, heartbeat se convertirá rápidamente en un proyecto zombie a favor de la pila openais/pacemaker. (Aparte: al realizar la configuración inicial del clúster para ocfs2, puede especificar 'pcmk' como motor del clúster en lugar de latido. No, esto no está documentado).

Por si sirve de algo, hemos vuelto a nfs administrado por pacemaker, porque los pocos segundos de tiempo de inactividad o algunos paquetes tcp descartados cuando pacemaker migra un recurso compartido de nfs a otra máquina es trivial en comparación con la cantidad de tiempo de inactividad que estábamos viendo para básico Operaciones de almacenamiento compartido como agregar máquinas cuando se usa ocfs2.

Question 3

Puede que no entienda bien sus requisitos, pero ¿ha miradohttp://en.wikipedia.org/wiki/List_of_file_systems#Distributed_file_systems

Answer

Puede que no entienda bien sus requisitos, pero ¿ha miradohttp://en.wikipedia.org/wiki/List_of_file_systems#Distributed_file_systems

Question 4

Echa un vistazo al chirridohttp://www.cse.nd.edu/~ccl/software/chirp/y lorohttp://www.cse.nd.edu/~ccl/software/parrot/

Answer

Echa un vistazo al chirridohttp://www.cse.nd.edu/~ccl/software/chirp/y lorohttp://www.cse.nd.edu/~ccl/software/parrot/

Sistema de archivos de almacenamiento distribuido: ¿cuál? ¿Existe un producto listo para usar?

Respuesta1

Respuesta2

Respuesta3

Respuesta4

información relacionada