Diagnosticando a memória do servidor Solaris 8 e o uso de espaço de troca

Question 1

Para descobrir se falta RAM em seus servidores, uma métrica útil seria a coluna sr na saída do comando vmstat. Basta executar algo como vmstat 10 10durante os períodos de referência e de pico (10 amostras a cada 10 segundos) e postar a saída. swap -sos resultados também seriam úteis. Alternativamente ao vmstat, você pode preferir executar. sar -g 5 5 Em qualquer caso, o server2 parece não ter RAM de acordo com a saída "top". Solaris tem um comando compatível semelhante ao top que também pode ajudar a identificar os consumidores de memória virtual e física:

prstat -s rss -n 5
prstat -s size -n 5

Answer

Para descobrir se falta RAM em seus servidores, uma métrica útil seria a coluna sr na saída do comando vmstat. Basta executar algo como vmstat 10 10durante os períodos de referência e de pico (10 amostras a cada 10 segundos) e postar a saída. swap -sos resultados também seriam úteis. Alternativamente ao vmstat, você pode preferir executar. sar -g 5 5 Em qualquer caso, o server2 parece não ter RAM de acordo com a saída "top". Solaris tem um comando compatível semelhante ao top que também pode ajudar a identificar os consumidores de memória virtual e física:

prstat -s rss -n 5
prstat -s size -n 5

Question 2

As coisas que se destacam para mim nesses instantâneos são as seguintes:

Muitos processos perl
Vários processos webservd
As máquinas estão 98% e 99% ociosas

Esses fatos levam às seguintes questões...

Você pode reduzir o número de processos Perl?
Suponho que não há como mudar para um modelo de servidor web encadeado.
Qual é a aparência da parte superior do sistema quando as máquinas estão sob estresse?

Finalmente, eu faria o seguinte para rastrear isso:

Use um sniffer de rede como o Wireshark para ver qual parte do processo HTTP está realmente sendo interrompida. É a conexão? É a entrega da página? É a entrega de uma parte dinâmica da página?
Obtenha uma ferramenta de estresse HTTP e sobrecarregue seus servidores web para ver como eles reagem. Observe as respostas com vmstat e top: gosto de usar screen em um terminal para fazer isso.

Boa sorte!

Answer

As coisas que se destacam para mim nesses instantâneos são as seguintes:

Muitos processos perl
Vários processos webservd
As máquinas estão 98% e 99% ociosas

Esses fatos levam às seguintes questões...

Você pode reduzir o número de processos Perl?
Suponho que não há como mudar para um modelo de servidor web encadeado.
Qual é a aparência da parte superior do sistema quando as máquinas estão sob estresse?

Finalmente, eu faria o seguinte para rastrear isso:

Use um sniffer de rede como o Wireshark para ver qual parte do processo HTTP está realmente sendo interrompida. É a conexão? É a entrega da página? É a entrega de uma parte dinâmica da página?
Obtenha uma ferramenta de estresse HTTP e sobrecarregue seus servidores web para ver como eles reagem. Observe as respostas com vmstat e top: gosto de usar screen em um terminal para fazer isso.

Boa sorte!

Question 3

Sempre achei que a maneira mais fácil de rastrear o uso da memória é a contabilidade do sistema. Ele pode pular bastante, por isso é importante revisar pelo menos uma semana para ver o padrão de uso.

Edite o crontab "sys" e você verá algumas execuções comentadas do script /usr/lib/sa/sa1. A frequência com que ele é executado determina o tempo de resolução dos dados contábeis salvos. Normalmente faço algo assim para um sistema 24x7:

20,40 * * * * /usr/lib/sa/sa1

Isso armazenará estatísticas em /var/adm/sa por dia do mês. Agora você usa sar para despejar as estatísticas de memória de qualquer um dos dias armazenados lá. Digamos que o dia 3 foi um dia de pico para mim:

sar -f /var/adm/sa/sa03 -g

A coluna de interesse principal é pgscan/s. Se esse número for superior a 200 por longos períodos de tempo, o sistema não terá memória suficiente. Aos 100 você provavelmente se beneficiará com mais memória, mas a degradação não é severa. Hoje em dia, com a troca de disco muito mais lenta que a memória, tento mantê-la em 0, exceto em saltos de curto prazo.

Answer

Sempre achei que a maneira mais fácil de rastrear o uso da memória é a contabilidade do sistema. Ele pode pular bastante, por isso é importante revisar pelo menos uma semana para ver o padrão de uso.

Edite o crontab "sys" e você verá algumas execuções comentadas do script /usr/lib/sa/sa1. A frequência com que ele é executado determina o tempo de resolução dos dados contábeis salvos. Normalmente faço algo assim para um sistema 24x7:

20,40 * * * * /usr/lib/sa/sa1

Isso armazenará estatísticas em /var/adm/sa por dia do mês. Agora você usa sar para despejar as estatísticas de memória de qualquer um dos dias armazenados lá. Digamos que o dia 3 foi um dia de pico para mim:

sar -f /var/adm/sa/sa03 -g

A coluna de interesse principal é pgscan/s. Se esse número for superior a 200 por longos períodos de tempo, o sistema não terá memória suficiente. Aos 100 você provavelmente se beneficiará com mais memória, mas a degradação não é severa. Hoje em dia, com a troca de disco muito mais lenta que a memória, tento mantê-la em 0, exceto em saltos de curto prazo.

Diagnosticando a memória do servidor Solaris 8 e o uso de espaço de troca

Responder1

Responder2

Responder3

informação relacionada