Rendimiento brillante

Rendimiento brillante

Actualmente intento configurar un clúster Gluster y el rendimiento es extraño y no estoy seguro si configuré algo mal. Estoy usando un servidor raíz Hetzner 4x que ejecuta Debian Buster con Intel i7, 128 GB de RAM, dos NVMe y un disco duro. Cada sistema tiene una interfaz de red independiente de 10 Gbs para la comunicación interna (todos los hosts están conectados directamente a un conmutador en un bastidor).

Cuando pruebo la red con iperf, tengo alrededor de 9,41 Gbits/seg entre todos los pares.

Instalé los paquetes predeterminados del servidor glusterfs de Debian (glusterfs-server_5.5-3_amd64.deb).

He construido tres volúmenes con:

  • SSD (gv0) en /mnt/ssd/gfs/gv0
  • Disco duro (gv1) en /mnt/hdd/gfs/gv1
  • Disco RAM (gv2) en /mnt/ram/gfs/gv2

Con

gluster volume create gv0 replica 2 transport tcp 10.255.255.1:/mnt/ssd/gfs/gv0 10.255.255.2:/mnt/ssd/gfs/gv0 10.255.255.3:/mnt/ssd/gfs/gv0 10.255.255.4:/mnt/ssd/gfs/gv0 force
...

Y algunos cambios de configuración: todos los volúmenes tienen este aspecto (gv0, gv1 y gv2 son iguales)

# gluster volume info gv0
 
Volume Name: gv0
Type: Distributed-Replicate
Volume ID: 0fd68188-2b74-4050-831d-a590ef0faafd
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: 10.255.255.1:/mnt/ssd/gfs/gv0
Brick2: 10.255.255.2:/mnt/ssd/gfs/gv0
Brick3: 10.255.255.3:/mnt/ssd/gfs/gv0
Brick4: 10.255.255.4:/mnt/ssd/gfs/gv0
Options Reconfigured:
performance.flush-behind: on
performance.cache-max-file-size: 512MB
performance.client-io-threads: off
nfs.disable: on
transport.address-family: inet

Posteriormente encontré algunas optimizaciones en la red. Pero el rendimiento no cambia mucho (por supuesto, es una prueba de rendimiento de un solo subproceso).

# gluster volume info gv0
 
Volume Name: gv0
Type: Distributed-Replicate
Volume ID: 0fd68188-2b74-4050-831d-a590ef0faafd
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: 10.255.255.1:/mnt/ssd/gfs/gv0
Brick2: 10.255.255.2:/mnt/ssd/gfs/gv0
Brick3: 10.255.255.3:/mnt/ssd/gfs/gv0
Brick4: 10.255.255.4:/mnt/ssd/gfs/gv0
Options Reconfigured:
performance.write-behind-window-size: 1MB
cluster.readdir-optimize: on
server.event-threads: 4
client.event-threads: 4
cluster.lookup-optimize: on
performance.readdir-ahead: on
performance.io-thread-count: 16
performance.io-cache: on
performance.flush-behind: on
performance.cache-max-file-size: 512MB
performance.client-io-threads: on
nfs.disable: on
transport.address-family: inet

También lo probé con marcos jumbo y sin él. Pero tampoco hizo ninguna diferencia.

# ip a s
...
2: enp3s0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 9000 qdisc mq state UP group default qlen 1000
    link/ether 6c:b3:11:07:f1:18 brd ff:ff:ff:ff:ff:ff
    inet 10.255.255.2/24 brd 10.255.255.255 scope global enp3s0
       valid_lft forever preferred_lft forever

Los tres volúmenes están montados directamente en uno de los pares.

10.255.255.1:gv0 /mnt/gv0 glusterfs defaults 0 0
10.255.255.1:gv1 /mnt/gv1 glusterfs defaults 0 0
10.255.255.1:gv2 /mnt/gv3 glusterfs defaults 0 0

Luego creé algunos datos de prueba en un disco RAM separado. Escribí un script que genera dd if=/dev/urandommuchos archivos con un bucle for. Primero generé los archivos, porque /dev/urandomparece que "finalizan" alrededor de 45 Mb/s cuando escribo en un disco RAM.

----- generate files 10240 x 100K
----- generate files 5120 x 1000K
----- generate files 1024 x 10000K
sum: 16000 MB on /mnt/ram1/

Y ahora viene el traspaso. Acabo de llamar, cp -r /mnt/ram1/* /mnt/gv0/etc. para escribir y cp -r /mnt/gv0/* /mnt/ram1/contar los segundos. Y eso parece terrible.

                    read    write
ram <-> ram           4s       4s
ram <-> ssd           4s       7s
ram <-> hdd           4s       7s
ram <-> gv0 (ssd)   162s     145s
ram <-> gv1 (hdd)   164s     165s
ram <-> gv2 (ram)   158s     133s

Por lo tanto, el rendimiento de lectura y escritura con el disco local en comparación con el clúster gluster es aproximadamente 40 veces más rápido. Eso no puede ser.

¿Qué extraño?

información relacionada