Proxy reverso NGINX HTTPS - TTFB rápido, mas baixa simultaneidade

Question

Bem, com base nas informações que você forneceu (e não forneceu), só posso adivinhar. Mas, a julgar pelo tipo de instância (t2 tem desempenho baseado em tickets expansíveis e, quando sem tickets, obtém cerca de 20% de um núcleo; não é uma boa instância para fazer benchmarks) e o uso de abpara testes (aliás. quando você o escreve como 'teste AB', a primeira coisa que vem à mente éesse) Eu diria que seu desempenho está praticamente dentro do esperado.

Ao iniciar uma sessão SSL ou TLS, a tarefa que exige mais desempenho não é a criptografia/descriptografia de dados, mas a troca de chaves. Como abnão utiliza cache de sessão SSL, a troca de chaves deve ser feita em todas as conexões.

Dependendo do conjunto de cifra/kex/auth realmente usado (não sei dizer, nenhuma absaída é fornecida), isso pode ser bastante trabalhoso para a CPU. E como ambas as extremidades estão na mesma máquina, você dobra os requisitos de CPU por conexão (é uma simplificação, mas é suficiente aqui).

No uso no mundo real, keep alives pode ajudá-lo a obter melhor desempenho (depende do cliente, navegadores normais o utilizam; tente ab -k). E você obterá melhor desempenho com o cache de sessão SSL mencionado (novamente depende do cliente, navegadores normais suportam).

Existem várias outras maneiras que ajudarão você a melhorar seu desempenho. Claro que você pode obter hardware melhor. Você pode otimizar o tamanho das chaves (depende do nível de proteção necessário para o aplicativo) - chaves menores geralmente são mais baratas para trabalhar. Testar em máquinas diferentes pode ou não melhorar o desempenho aparente. E obter uma compilação OpenSSL diferente, ou uma biblioteca SSL completamente diferente, também pode fornecer melhor desempenho.

Apenas para referência, você pode dar uma olhada emeste papelpela Intel. Eles comparam o desempenho em uma máquina altamente otimizada (e em alguns softwares otimizados). Considere que você tem menos de 1/30 do poder de computação disponível (pode ser tão baixo quanto 1/150 se você estiver sem ingressos).

Porém, se você precisar de SSL de alto desempenho, pode valer a pena considerar o uso do Amazon ELB para fazer a terminação SSL para você, já que você já está no EC2.

Editar: por exemploApache JMeterusa cache de contexto SSL.httperftambém faz. Acho especialmente o JMeter bom em simular cargas semelhantes à vida real. Mas para esse modo httperf de cache de sessão poderia funcionar melhor.

Não ver nenhuma diferença -kpode ser porque ainda não foi usado. Depende das configurações de simultaneidade e (pelo menos na minha máquina) parece depender também do URL. Ele não usa keepalives se eu usar um nome de domínio que aponte para mais de um IP na URL (não me pergunte por quê).

Dependendo da sua percepção de massivo, eu não esperaria obter mais do que cerca de 500 conexões por segundo em rajadas nesta instância bastante pequena e não mais do que 250 cps sustentados.

Comparar o http de texto simples do verniz com o nginx SSL é comparar peras com maçãs. Ou melhor, comparar mirtilos com melancias em termos de requisitos de hardware.

Novamente para sua referência (observe a Keep-Alive requests: 100linha).

Sem-k

Concurrency Level:      1
Time taken for tests:   0.431 seconds
Complete requests:      100
Failed requests:        0
Total transferred:      399300 bytes
HTML transferred:       381200 bytes
Requests per second:    232.26 [#/sec] (mean)
Time per request:       4.305 [ms] (mean)
Time per request:       4.305 [ms] (mean, across all concurrent requests)
Transfer rate:          905.69 [Kbytes/sec] received

Com-k

Concurrency Level:      1
Time taken for tests:   0.131 seconds
Complete requests:      100
Failed requests:        0
Keep-Alive requests:    100
Total transferred:      402892 bytes
HTML transferred:       381200 bytes
Requests per second:    762.11 [#/sec] (mean)
Time per request:       1.312 [ms] (mean)
Time per request:       1.312 [ms] (mean, across all concurrent requests)
Transfer rate:          2998.53 [Kbytes/sec] received

Edit2: Bem, você precisa entender que servir conteúdo diretamente da memória (é isso que o Varnish está fazendo) é o mais fácil possível. Você analisa os cabeçalhos, encontra o conteúdo na memória e cospe-o. E o verniz é excelente nisso.

Estabelecer uma conexão criptografada é um nível completamente diferente. Assim, depois de adicionar o nginx, ele terá que fazer o handshake SSL (troca de chaves, autenticação) e a criptografia, que exigem muito mais recursos. Em seguida, ele analisa os cabeçalhos. Então ele tem que criar outra conexão TCP com o Varnish.

Novamente, no mencionadoArtigo da Intel, eles têm 28 núcleos e fizeram alguns ajustes em seu OpenSSL para fazer 38k HTTPS cps (um pouco mais do que o desempenho do Varnish). Você tem cerca de 1/5 de um núcleo e é afetado por seus vizinhos virtuais.

CitandoLista de instâncias do Amazon EC2:

Por exemplo, uma instância t2.small recebe créditos continuamente a uma taxa de 12 créditos de CPU por hora. Esse recurso fornece desempenho básico equivalente a 20% de um núcleo de CPU.

E ainda outropapeldo próprio nginx:

Resumo dos resultados Um único núcleo Intel virtualizado normalmente pode executar até 350 operações completas de handshake SSL de 2.048 bits por segundo, usando cifras criptográficas modernas. Isso equivale a várias centenas de novos usuários do seu serviço por segundo, por núcleo.

Answer 1