Rendimiento lento de lectura/escritura en iSCSI SAN

Rendimiento lento de lectura/escritura en iSCSI SAN

Esta es una nueva configuración de ESXi 4.0 que ejecuta máquinas virtuales desde una SAN Cybernetics miSAN D iSCSI.

Al realizar una prueba de lectura de datos elevados en una máquina virtual, tomó 8 minutos frente a 1,5 minutos en la misma máquina virtual ubicada en un host VMWare Server 1.0 más lento con las máquinas virtuales ubicadas en el disco local. Estoy observando mis velocidades de lectura desde la SAN, y está obteniendo un poco más de 3 MB/s de lectura máxima, y ​​el uso del disco en la VM coincide con poco más de 3 MB/s... terriblemente lento.

Tanto el servidor como la SAN están conectados al mismo conmutador de 1 GB. He seguido esta guía

virtualgeek.typepad.com/virtual_geek/2009/09/a-multivendor-post-on-using-iscsi-w ith-vmware-vsphere.html

para configurar correctamente las rutas múltiples, pero todavía no obtengo un buen rendimiento con mis máquinas virtuales. Sé que la SAN y la red deberían poder manejar más de 100 MB/s, pero no lo entiendo. Tengo dos NIC de GB en la SAN con rutas múltiples a dos NIC de GB en el host ESXi. Una NIC por VMkernel. ¿Hay algo más que pueda comprobar o hacer para mejorar mi velocidad? Gracias de antemano por cualquier consejo.

Respuesta1

Ese hardware SAN está certificado para Vmware, así que solicite soporte para investigarlo. Las causas comunes del mal rendimiento son la sobrecarga de la interfaz del hardware SAN, porque si tiene varias conexiones a la misma SAN no todas pueden funcionar a la máxima velocidad.

Además, su disco local siempre será más rápido que su SAN en su configuración, porque incluso un disco SATA tendrá un ancho de banda máximo de 3 Gb/s, por lo que su SAN nunca igualará la velocidad de sus discos locales. Probablemente también esté utilizando Ethernet en lugar de fibra, lo que tampoco ayuda al rendimiento.

Utiliza una SAN no solo por la velocidad, sino también para tener un lugar central administrado donde puede colocar todos sus datos importantes y asegurarse de que se esté aplicando un nivel RAID adecuado. También existen ciertas características como la replicación, que es una de las ventajas de tener una SAN.

Respuesta2

Esa configuración debería poder ofrecer un rendimiento razonable y, por lo que puedo deducir, esa matriz puede soportar alrededor de 60-70 megabytes por segundo, incluso para E/S aleatorias de bloques pequeños. No tengo experiencia con ellos, pero la especificación indica que debería poder manejar fácilmente sus requisitos y las pocas revisiones que arrojan las búsquedas lo respaldan.

De todos modos, si yo fuera tú, primero daría un paso atrás. Deshágase de las rutas múltiples (inicialmente) y asegúrese de poder obtener una ruta única (en el lado de VMware) para mantener un rendimiento respetable. Suponiendo que tiene una unidad de 8 unidades, completamente equipada con unidades SAS de 10k, un repuesto dinámico y un paquete RAID 5 de 7 unidades, debería poder ofrecer fácilmente lectura o escritura secuencial de >100 MB/s a través de una única interfaz en una buena y dedicada Gbit LAN incluso representa toda la sobrecarga de ip\tcp e iSCSI. Realice pruebas masivas simples de copias de archivos grandes (algo significativamente más grande que el caché de escritura en la matriz) hacia o desde la SAN para verificar que está viendo eso. Si está leyendo y escribiendo en el volumen SAN, el rendimiento no será más de la mitad, por cierto. Si no, entonces querrás mirar a todos los sospechosos habituales:

  • Para empezar, asegúrese de que la caché de SAN esté configurada correctamente.
  • Asegúrese de que todas las unidades estén en buen estado, es decir, que no esté luchando contra una reconstrucción RAID.
  • Asegúrese de que el conmutador esté en buen estado y no esté ocupado con otras cosas; lo ideal es aislar el tráfico SAN en su propio conmutador; si no puede hacerlo, colóquelo en su propia VLAN.
  • Definitivamente no lo coloques en un interruptor barato que esté muy ocupado con otras cosas.
  • Verifique la configuración de velocidad y dúplex en todos los puertos (ESX, Switch y SAN)
  • Evite jugar con Jumbo Frames y ESX hasta que sepa que todo lo demás está funcionando
  • Definitivamente habilite el control de flujo de hardware en el conmutador

Cuando esté realizando pruebas, asegúrese de que ni el host ESX ni la SAN estén ocupados con nada más.

Una vez que obtenga >100Meg/seg para el tráfico secuencial en un único enlace ascendente, podrá considerar ver si las rutas múltiples marcan la diferencia. Con iSCSI en ESX4 es posible, pero es poco probable a menos que la matriz de almacenamiento lo admita correctamente junto con ESX 4. Consultaría al proveedor de la matriz para obtener orientación al respecto.

Respuesta3

Las rutas múltiples pueden estar causando su problema. ¿Puede (y lo ha intentado) desactivar las rutas múltiples y tener solo una conexión de 1 Gb a su SAN? VMware puede sufrir cambios de ruta cuando se lo carga debido a un enlace defectuoso o un retraso en la entrega de paquetes...

Por cierto, su rendimiento máximo con un enlace de 1 Gb será de ~30 MBytes/seg si su SAN y su host ESXi fueran los únicos dos dispositivos en ese enlace...

Respuesta4

Tenga en cuenta que el controlador IO de múltiples rutas (MPIO) nativo en VMware es solo activo/pasivo, por lo que solo usará una ruta por LUN. Entonces, si todo su tráfico va a un solo LUN, solo usará una ruta para llevar ese tráfico allí. El único controlador MPIO de terceros compatible (que yo sepa) es PowerPath de EMC, que es un controlador MPIO activo/activo, pero requiere la edición Enterprise Plus de vSphere.

Algunas cosas para mirar.

¿Ha habilitado Jumbo Frames en la SAN, el conmutador y el host? ¿La SAN muestra algún problema de rendimiento a través de sus herramientas de monitoreo? ¿Cuántos discos hay detrás del LUN en cuestión? ¿Cuántas otras cosas están llegando a esos mismos discos?

información relacionada