Rendimiento lento de NFS y GFS2

Question 1

Sólo puedo dar algunas indicaciones generales.

Primero, pondría en funcionamiento algunas métricas de referencia simples. Al menos así sabrás si los cambios que estás realizando son para mejor.

Munín
cactus
Nagios

son algunas buenas opciones.

¿Son estos nodos servidores virtuales o físicos? ¿Cuáles son sus especificaciones?

¿Qué tipo de conexión de red hay entre cada nodo?

¿Está configurado NFS en la red privada de su proveedor de hosting?

No estás limitando paquetes/puertos con firewalls. ¿Tu proveedor de hosting está haciendo esto?

Answer

Sólo puedo dar algunas indicaciones generales.

Primero, pondría en funcionamiento algunas métricas de referencia simples. Al menos así sabrás si los cambios que estás realizando son para mejor.

Munín
cactus
Nagios

son algunas buenas opciones.

¿Son estos nodos servidores virtuales o físicos? ¿Cuáles son sus especificaciones?

¿Qué tipo de conexión de red hay entre cada nodo?

¿Está configurado NFS en la red privada de su proveedor de hosting?

No estás limitando paquetes/puertos con firewalls. ¿Tu proveedor de hosting está haciendo esto?

Question 2

Creo que tienes dos problemas. Un cuello de botella que causa el problema en primer lugar y, lo que es más importante, un mal manejo de fallas por parte de GFS. GFS realmente debería ralentizar la transferencia hasta que funcione, pero no puedo ayudar con eso.

Usted dice que el clúster maneja ~200 GB de archivos nuevos en el NFS. ¿Cuántos datos se leen del clúster?

Siempre me pondría nervioso tener una conexión de red para el frontend y el backend, ya que permite que el frontend rompa "directamente" el backend (sobrecargando la conexión de datos).

Si instala iperf en cada una de las cajas, puede probar el rendimiento de red disponible en cualquier punto dado. Esta puede ser una forma rápida de identificar si tiene un cuello de botella en la red.

¿En qué medida se utiliza la red? ¿Qué tan rápidos son los discos en el servidor de almacenamiento y qué configuración de raid estás usando? ¿Qué rendimiento obtienes con él? Suponiendo que esté ejecutando *nix y tenga un momento de tranquilidad para probar, puede usar hdparm

$ hdpard -tT /dev/<device>

Si encuentra un uso intensivo de la red, le sugeriría que coloque GFS en una conexión de red secundaria y dedicada.

Dependiendo de cómo haya atacado los 12 discos, puede tener distintos grados de rendimiento y este podría ser el segundo cuello de botella. También dependerá de si está utilizando un raid de hardware o un raid de software.

La gran cantidad de memoria que tiene en la caja puede ser de poca utilidad si los datos que se solicitan se distribuyen en más que su memoria total, lo que parece que es así. Además, la memoria solo puede ayudar con las lecturas y, sobre todo, si muchas de las lecturas son para el mismo archivo (de lo contrario, sería expulsado del caché).

Cuando ejecute top/htop, mire iowait. Un valor alto aquí es un excelente indicador de que la CPU simplemente está dando vueltas esperando algo (red, disco, etc.)

En mi opinión, es menos probable que NFS sea el culpable. Tenemos una experiencia bastante amplia con NFS y, si bien se puede ajustar/optimizar,tiendepara funcionar de manera bastante confiable.

Me inclinaría por estabilizar el componente GFS y luego ver si los problemas con NFS desaparecen.

Finalmente, OCFS2 puede ser una opción a considerar como reemplazo de GFS. Mientras investigaba un poco sobre sistemas de archivos distribuidos, investigué bastante y no recuerdo las razones por las que elegí probar OCFS2, pero lo hice. Quizás tuvo algo que ver con que Oracle utilizara OCFS2 para sus backends de bases de datos, lo que implicaría requisitos de estabilidad bastante altos.

Munin es tu amigo. Pero mucho más importante es top/htop. vmstat también puede darle algunos números clave

$ vmstat 1

y recibirá una actualización cada segundo sobre exactamente en qué dedica su tiempo el sistema.

¡Buena suerte!

Answer

Creo que tienes dos problemas. Un cuello de botella que causa el problema en primer lugar y, lo que es más importante, un mal manejo de fallas por parte de GFS. GFS realmente debería ralentizar la transferencia hasta que funcione, pero no puedo ayudar con eso.

Usted dice que el clúster maneja ~200 GB de archivos nuevos en el NFS. ¿Cuántos datos se leen del clúster?

Siempre me pondría nervioso tener una conexión de red para el frontend y el backend, ya que permite que el frontend rompa "directamente" el backend (sobrecargando la conexión de datos).

Si instala iperf en cada una de las cajas, puede probar el rendimiento de red disponible en cualquier punto dado. Esta puede ser una forma rápida de identificar si tiene un cuello de botella en la red.

¿En qué medida se utiliza la red? ¿Qué tan rápidos son los discos en el servidor de almacenamiento y qué configuración de raid estás usando? ¿Qué rendimiento obtienes con él? Suponiendo que esté ejecutando *nix y tenga un momento de tranquilidad para probar, puede usar hdparm

$ hdpard -tT /dev/<device>