Montei uma caixa ESX para melhor gerenciamento, mas seu desempenho é um item WTF; Sou novato em lidar com ESX, então estou procurando uma longa lista de material de leitura para me ajudar a esclarecer isso para que eu possa voltar à programação .NET.
Sistema de armazenamento atual:
Estamos executando Raid5 + Hotspare (fusos de 8x500 GB) em um PERC6i em um Dell 2910. Devido às limitações do ESX, o PERC está mostrando o armazenamento como "partições" de 1x2TB + 1x800GB. Não tenho certeza da configuração do setup (stride / stripe / ???).
Nossas Aplicações
Temos um servidor SBS, bem como um servidor de banco de dados menor (2x50 GB, mas crescendo a 10 GB/mês)...
Nosso aplicativo que reside na VM do banco de dados é insensível à CPU e à E/S; é um exercício de agitação de banco de dados misturado com muita computação nos dados (consertar esse desempenho é o que eu deveria estar trabalhando) ...
Problema de desempenho
Quando faço um backup, uma restauração ou pior (copio um backup de 1 VM para outra para movê-lo para a VM de controle de qualidade), todo o sistema fica lento (até mesmo VMs "não relacionadas").
Originalmente, pensei que uma situação DASD seria muito boa, já que você tinha largura de banda PCI-x, mas a desaceleração de todo o sistema está matando a produtividade.
Questões
- O que devo fazer para tomar uma decisão inteligente sobre NAS vs RAID vs SAN vs DASD?
- Existem pontos ideais/pontos feios na configuração de armazenamento?
- Você pode usar uma placa SSD PCI-X no ESX para o tempdb? Boa/má ideia?
- Existe alguma maneira de "compartilhar" alguma imagem no modo copy-on-write? A maior parte do "Backup-Copy-Restore" consiste em "colocar uma imagem limpa nas caixas de desenvolvimento"; se eu pudesse fazer com que eles "compartilhassem" a imagem mestre, a "cópia grande" (2x50 GB) só precisaria ser feita uma vez por semana, em vez de uma vez por desenvolvedor por semana...[o desempenho do tempo de execução não é uma preocupação com o dev boxes, mas o backup/cópia/restauração mata a produção, o SBS e tudo mais na caixa]
Responder1
Você não fornece detalhes sobre a especificação do servidor ESX - número de CPUs, quantidade de RAM, quantas VMs você está executando e quais são suas configurações e requisitos de desempenho esperados, então presumo que tudo isso esteja OK no momento e que o problema que você tem é definitivamente relacionado apenas ao armazenamento IO. No mínimo, você deve ter núcleos e RAM suficientes para executar todas as suas VMs ativas sem contenção e espaço suficiente para garantir que haja capacidade suficiente para o hipervisor fazer tudo o que precisa sem interromper as VMs ou forçá-las a paginar para o disco . Além disso, como Frederic mencionou, você deve ter o VMware Tools instalado e, se puder, usar o adaptador SCSI paravirtualizado para suas unidades de dados, isso ajudará.
Pergunta [1] - DAS\RAID\NAS\SAN
Você precisa fornecer mais E/S e mais E/S independente para separar as cargas de trabalho umas das outras. Se você optar por NAS\DAS\SAN, isso exigirá a configuração de pacotes RAID separados, de preferência em RAID 10. Para o seu estilo de E/S, os benefícios de desempenho do RAID 10 em relação ao RAID 5 (o dobro do desempenho de E/S de gravação para o mesmo número de fisks) é aconselhável. Você deseja garantir que a VM primária com uso intensivo de IO esteja sendo executada a partir de um armazenamento de dados separado para o sistema de controle de qualidade, especialmente se os procedimentos de controle de qualidade provavelmente sobrecarregarem seriamente o armazenamento, o que presumo que ocorrerá. Dividir seu pacote atual de 8 unidades em 2 pacotes RAID 10 separados de 4 ajudaria muito. Seria melhor alterar o pacote RAID 5 existente de 8 unidades para RAID 10 e adicionar armazenamento independente separado para o sistema de controle de qualidade. Você pode fazer tudo isso com armazenamento conectado diretamente, mas o desempenho será melhor dimensionado com SANs e sistemas NAS de última geração. Porém, eles também custarão muito mais.
Pergunta [2] Pontos ideais/pontos feios com armazenamento existente
Você tem discos suficientes para executar cerca de 10 a 15 servidores Windows médios (a média é arquivo\print\DC's\low IO app boxes, não SQL, SBS ou Exchange), mas não o suficiente para executar muito mais do que uma máquina verdadeiramente com uso intensivo de IO no conjunto atual acima. A feiúra é ter um único pacote RAID 5 para tudo. Se suas unidades existentes forem SATA, isso não é bom, pois provavelmente terão 7.200 rpm, na melhor das hipóteses, a mudança para unidades de 10kSAS duplicará mais ou menos o desempenho para a mesma contagem de fusos, e as unidades de 15k triplicarão.
Pergunta[3] Usando SSDs PCI-X
O ESX não oferece suporte ao AFAIK do SSD PCI-X \ PCI-e, mas se isso acontecer, isso ajudaria como um local para qualquer um de seus volumes de VM intensos de IO. No que diz respeito à execução do tempDB, idealmente, sim, você deve colocá-lo em um VMDK com armazenamento rápido, mas primeiro certifique-se de que a VM tenha tanta RAM quanto possa ser usada de forma lucrativa.
Pergunta [4] Opções de imagem compartilhada
O VMware Lab Manager fará esse tipo de coisa para você, mas requer uma infraestrutura de VI totalmente licenciada e uma licença por CPU para cada servidor em seu cluster. Isso ajudará no gerenciamento e terá alguns aspectos positivos em potencial para o seu caso de uso de cópia de controle de qualidade, mas também é possível que isso não ajude a resolver problemas de desempenho - se o sistema de controle de qualidade estiver sendo fortemente controlado de uma perspectiva de IO, então o método Copy-On-Write\delta A abordagem de cópia usada para provisionar vários sistemas a partir de uma única imagem base não ajuda em seus problemas gerais de desempenho e provavelmente irá piorá-los. Isso tornará a criação de cópias muito mais fácil e rápida.
Responder2
Seu problema não está relacionado com DAS ou NAS, mas com CRAP DISCS. Muitas VMs têm muito mais IO do que um computador normal. O uso de discos FAST é obrigatório aqui, a menos que você tenha padrões de uso realmente baixos.
- Você está bem para uma configuração menor com um sistema DAS, se tiver um bom controlador RAID (linha Adaptec) e um bom número de discos.
- SAN (não NAS) tem a vantagem de ser compartilhável entre múltiplas caixas (failover, clustering etc.)
Seja como for, você precisa de MUITOS IO possíveis. As regras são:
- VMs NÃO devem usar o arquivo de página. A paginação estressa o disco - e os discos são sua limitação brutal de qualquer maneira.
- RAID 5 é muito mais lento que RAID 10;)
- Os discos de 500 GB provavelmente têm no máximo 7.200 RPM - e isso é lento. Vá para 10.000 RPM no mínimo, infraestrutura SAS. Tenho experiências muito boas com um RAID 10 de Velociraptors de 300GB (embora os novos 600GB sejam um pouco mais rápidos).
Você realmente precisa de MUITA capacidade de IO. Seu RAID 5 é apenas um pouco mais rápido que dois discos (se for o caso - eu teria que fazer as contas) e um único disco já não é exatamente rápido para determinados cenários. O resultado é que sua configuração de IO simplesmente morre. Normal.
Se você instalasse um RAID 10 de 8 discos (500 GB ou 2 TB), obteria MUITO mais capacidade de E/S independente do que com um RAID 5.
Responder3
(1) e (2): se você usar um armazenamento local, não poderá usar todos os recursos do VMware (ha, ft, vmotion, etc.). Eu uso iSCSI em uma SAN EQL: o desempenho é muito ruim, devido a uma implementação ruim de iSCSI (cerca de 2 Gbps na gravação) e ao raid6 usado. Com o raid10 IO, o desempenho deve ser realmente melhor. Então, se você tiver dinheiro, use uma FC SAN... ou espere pela FCoE SAN :) com raid10... Na minha opinião, para IO intenso, não use SAN de baixo custo...
(3) não sei
Você já tentou configurar as ferramentas de convidado para reduzir sua lentidão? Tivemos o mesmo problema com um banco de dados Oracle e configurar as ferramentas convidadas realmente aumentou o desempenho. Também usamos os drivers scsi paravirtualizados em nosso RHEL para obter mais desempenho!
Frederico
Responder4
Poderia ser esse o seu problema?
De qualquer forma, atualize todas as bioses. O disco é sata ou sas? A julgar pelo espaço eu diria sata...não os discos mais rápidos. Se você deseja o melhor desempenho, tente o raid 10 em vez do 5. NAS, SAN e DAS são uma coisa...RAID é a base para quase todos eles. Em breve:
NAS: exporta um sistema de arquivos (nfs, smb)
SAN: exporta um dispositivo de bloco (iscsi, lun, aoe)
DAS: todas as caixas de armazenamento conectadas diretamente ao servidor (scsi, esata)
RAID: é uma forma de aumentar a disponibilidade do sistema no caso de alguma falha no disco.