¿Alguien puede ayudar a interpretar la alta latencia/bajo rendimiento en un host ESXi (almacenamiento de conexión directa)?

¿Alguien puede ayudar a interpretar la alta latencia/bajo rendimiento en un host ESXi (almacenamiento de conexión directa)?

como descargo de responsabilidad: no soy un tipo de almacenamiento, así que ELI5;) Estoy viendo un ESXi con almacenamiento conectado directamente (SSD y HDD SAS en un RAID1, diferentes almacenes de datos). El sistema X que se muestra en los gráficos está en el HDD RAID, el otro (System Z) en los SSD.

Gráfico de latencia de ESXi - System X Gráfico de latencia de ESXi - System X

Gráfico de latencia de ESXi - System Z Gráfico de latencia de ESXi - System Z

Ambos sistemas utilizan bases de datos (entre otras cosas). El Sistema X (que se muestra en el gráfico) consulta datos del Sistema Z (Postgres), los importa parcialmente y los muestra. Como puede ver, aquí tenemos una latencia bastante alta. También puedo ver sólo un rendimiento bajo para el Sistema X. El Sistema X tiene bloqueos frecuentes de la base de datos.

Ambos sistemas tienen CPU y RAM en abundancia, lo único que veo son problemas de rendimiento del disco.

Sin información adicional: la latencia parece una locura, ¿verdad? Mi primer consejo fue separar los sistemas en almacenes de datos dedicados (y, por lo tanto, en discos subyacentes), ya que ambos tienden a tener requisitos de IOPS muy altos.

Desafortunadamente no tengo tantos detalles, pero estoy buscando algunas buenas preguntas para hacer al final. Planeo investigar el sistema de archivos y las opciones de montaje, el aprovisionamiento del disco (delgado/grueso), tal vez hacer algunas pruebas con dd/hdparm/fio. Compruebe si tenemos reescritura en el RAID. ¿Qué más debo comprobar?

Gracias mmf

información relacionada