¿Almacenamiento de datos distribuido para redes lentas con alta rotación de nodos?

¿Almacenamiento de datos distribuido para redes lentas con alta rotación de nodos?

¿Qué almacenamiento de datos distribuidos debo utilizar para almacenar datos de manera confiable en un conjunto de nodos con una red deficiente entre ellos?

Quiero algo que:

  • No espera que todos los nodos sean accesibles ahora, incluido el soporte de operación fuera de línea;
  • Inicialmente, almacene los datos localmente, pero eventualmente (cuando la red sea buena y haya más nodos en línea) los difundirá a otros nodos necesarios;
  • Tener un buen reequilibrio y reparación automáticos ante la entrada y salida de nodos de la red;
  • Manejar nodos que difieren mucho en capacidad, almacenando solo cosas pequeñas y de alta prioridad en nodos pequeños;
  • Trate el nodo local de manera especial: "mis" datos siempre se almacenan primero en el nodo local y luego se respaldan en otros nodos.

La mayoría de las soluciones como Tahoe-LAFS o GlusterFS parecen esperar un conjunto de nodos más o menos estables mantenidos en línea y conectados con una buena red, sin tiempos de inactividad prolongados planificados. ¿Existe un almacenamiento distribuido especial que espera que los nodos estén fuera de línea de forma regular?

información relacionada