Alguém pode ajudar a interpretar alta latência/baixa taxa de transferência em um host ESXi (armazenamento conectado diretamente)

Alguém pode ajudar a interpretar alta latência/baixa taxa de transferência em um host ESXi (armazenamento conectado diretamente)

como isenção de responsabilidade - não sou um cara de armazenamento, então ELI5;) Estou olhando para um ESXi com armazenamento de conexão direta (SSDs e HDDs SAS em um RAID1, armazenamentos de dados diferentes). O Sistema X mostrado nos gráficos está no HDD RAID, o outro (System Z) nos SSDs.

Gráfico de latência do ESXi - System X Gráfico de latência do ESXi - System X

Gráfico de latência do ESXi - System Z Gráfico de latência do ESXi - System Z

Ambos os sistemas usam bancos de dados (juntamente com outras coisas). O System X (mostrado no gráfico) consulta dados do System Z (Postgres), importa-os parcialmente e exibe-os. Como você pode ver, temos uma latência bastante alta aqui. Também posso ver apenas baixo rendimento para o System X. O System X tem bloqueios de banco de dados frequentes.

Ambos os sistemas têm CPUs e RAM em abundância, tudo que posso ver são problemas de desempenho do disco.

Sem informações adicionais - a latência parece louca, certo? Meu primeiro conselho foi separar os sistemas em datastores dedicados (e, portanto, em discos subjacentes), pois ambos tendem a ter requisitos de IOPS muito altos.

Infelizmente não tenho tantos detalhes, mas estou procurando algumas boas perguntas para fazer no final. Pretendo examinar o sistema de arquivos e as opções de montagem, o provisionamento do disco (fino/grosso), talvez fazer alguns testes com dd/hdparm/fio. Verifique se temos write-back no RAID. O que mais devo verificar?

Obrigado, MMF

informação relacionada