Escalonamento e teste de carga Django Nginx e Gunicorn: 502 Server Error + Recurso temporariamente indisponível gunicorn.sock

Estou fazendo testes de carga com o locust para ver se meu servidor aguenta 1.500 usuários.

O que estou usando: Django, Nginx, Gunicorn, Postgresql Meu droplet: 24vCPUs, 128GB de RAM, 25GB SSD

com cerca de 1100 usuários, começo a receber os seguintes erros no locust:

GET / HTTPError('502 Server Error: Bad Gateway for url: ')
GET /aboutpage/     HTTPError('502 Server Error: Bad Gateway for url: ')

No meu nginx error.log recebo os seguintes erros:

2020/01/26 23:14:17 [error] 30465#30465: *167765 connect() to unix:/var/www/file/to/sock/gunicorn failed (11: Resource temporarily unavailable) while connecting to upstream, client: 8x.8x.1xx.3x, server:, request: "GET // HTTP/1.1", upstream: "http://unix:/var/www/file/to/sock/gunicorn://", host: ""

por algum motivo, isso me diz que meu recurso está temporariamente indisponível.

Aqui está meu nginx.conf:

user www-data;
worker_processes auto;
pid /run/;
include /etc/nginx/modules-enabled/*.conf;

events {
        worker_connections 2048;
        # multi_accept on;

http {

        # Basic Settings

        sendfile on;
        tcp_nopush on;
        tcp_nodelay on;
        keepalive_timeout 65;
        types_hash_max_size 2048;
        # server_tokens off;

        # server_names_hash_bucket_size 64;
        # server_name_in_redirect off;

        include /etc/nginx/mime.types;
        default_type application/octet-stream;

        # SSL Settings

        ssl_protocols TLSv1 TLSv1.1 TLSv1.2; # Dropping SSLv3, ref: POODLE
        ssl_prefer_server_ciphers on;

        # Logging Settings

        access_log /var/log/nginx/access.log;
        error_log /var/log/nginx/error.log;

        # Gzip Settings

        gzip on;

        # gzip_vary on;
        # gzip_proxied any;
        # gzip_comp_level 6;
        # gzip_buffers 16 8k;
        # gzip_http_version 1.1;
        # gzip_types text/plain text/css application/json application/javascript text/xml application/xml application/xml+rss text/javascript;

        # Virtual Host Configs
        include /etc/nginx/conf.d/*.conf;
        include /etc/nginx/sites-enabled/*;

E aqui está a configuração do meu bloco de servidor:

upstream mysite-production {
    server unix:/var/www/path/to/sock/gunicorn;
server {
    listen [::]:80;
    listen 80;

    # set client body size to 100M #
    client_max_body_size 100M;

    location / {
      include proxy_params;
      proxy_pass http://unix:/var/www/path/to/sock/gunicorn;
      auth_basic "Restricted Content";
      auth_basic_user_file /etc/nginx/.htpasswd;

    location /static/ {
        root /var/www/site/production/;
        expires 30d;
        add_header Vary Accept-Encoding;
        access_log off;
        gzip on;
        gzip_comp_level 6;
        gzip_vary on;
        gzip_types text/plain text/css application/json application/x-javascript application/javascript text/xml application/xml application/rss+xml text/javascript image/svg+xml application/ application/x-font-ttf font/opentype;

    location /media/ {
        root /var/www/site/production/;
        expires 30d;
        add_header Vary Accept-Encoding;
        access_log off;


Aqui está meu arquivo de serviço gunicorn:

Description=mysite production daemon

ExecStart=/var/www/path/to/venv/bin/gunicorn  --workers=49 --bind unix:/var/www/path/to/sock/gunicorn --log-level DEBUG --log-file '/var/www/path/to/log/gunicorn.log' mysite.wsgi:application
ExecReload=/bin/kill -s HUP $MAINPID
ExecStop=/bin/kill -s TERM $MAINPID


O que poderia estar causando este problema? Estamos prevendo que cerca de 1.500 a 2.000 usuários simultâneos estarão no site ao mesmo tempo.

Obrigado por tomar o tempo! Estou ansioso por suas respostas!


Ao testar a carga, você sempre encontrará limites e gargalos.

No seu caso você precisa aumentar emconfiguração de gunicórniodo backlogvalor padrão 2048para algo que seu servidor possa manipular.

