Testes de rendimento do Fedora SSD NMVe muito altos

Testes de rendimento do Fedora SSD NMVe muito altos

Estou testando o rendimento de uma placa SSD Samsung 950 Pro que usa o protocolo NVMe. Meu método atual de teste é montar um sistema de arquivos em uma partição e gravar um arquivo de tamanho X bytes no sistema de arquivos. Registrando o tempo necessário para fazer isso, os bytes/segundo podem ser calculados.

No meu teste, tenho um loop while que gravará os X bytes em tamanhos de bloco variáveis, um bloco por vez, especificado por um loop for de nível superior. Além disso, também tenho outro loop que executará N desses aplicativos em paralelo, cada aplicativo gravando em uma partição diferente do SSD.

Atualmente, estou vendo velocidades um pouco mais rápidas do que a velocidade máxima de transferência teórica especificada pela folha de dados do Samsung 950 Pro para leitura e gravação. A Samsung especificou que a velocidade máxima de gravação sequencial para o 950 Pro é de 1,5 GB/s e a velocidade máxima de leitura sequencial é de 2,5 GB/s.

https://www.samsung.com/us/computing/memory-storage/solid-state-drives/ssd-950-pro-nvme-512gb-mz-v5p512bw/#specs

Aqui está a função principal do script bash que percorre o número de aplicativos a serem executados e os tamanhos dos blocos:

appInstances=1
while [ $appInstances -le 4 ]
do
    for blocksize in 4096 32768 131072 524288 1048576 67108864 268435456 1073741824
    do
       # Run the test
       datetime
       echo "[$datetime_v]: Test blocksize: $blocksize appInstances: $appInstances"
       run_single_perf_test $blocksize

    done

    appInstances=`expr $appInstances \* 2`

done
exit 0

Aqui está a seção de gravação de run_perf_test. Há também uma seção de leitura após esta parte, que compreende o teste de velocidade de transferência de escrita. Entre os testes, desmonto todas as partições do SSD e as remonto para permitir que todas as transações NVMe sejam concluídas e evitar que qualquer cache de operações de gravação influencie a medição de rendimento para a operação de leitura.

instCnt=1
childpids=""
while [ $instCnt -le $appInstances ]
do
fsrw -w $blocksize /fsmnt/fs${instCnt}/usernumber1/j.j &

# Save the process ID
childpids="$childpids $!"

# Increment the instace count.
instCnt=`expr $instCnt + 1`
done

fsrw é um aplicativo C++ que baseado no primeiro argumento, "-r" ou "-w", o segundo argumento, o tamanho do bloco, e o terceiro argumento, o nome do arquivo que é um arquivo na partição SSD, irá construir uma string e tente abrir o arquivo na partição SSD e gravar a string nele. Aqui está a implementação da função write, que é chamada quando "-w" é fornecido como primeiro argumento.

/*! \fn perform_writeop()
 *  \brief The function returns true when the write operation completes successfully. 
 *
 *  The function will run until the read is complete or a 35 second timeout is reached.
 *  It will record the time before the write begins, then also record the time afterward.
 *  If the timeout is reached this should be about 35 seconds
 */
bool perform_writeop ()
{
    // File descriptor.
    int32_t fd = -1;

    // Function status.
    bool status = false;

    // Zero writes
    int zero_writes = 0;

    // Buffer fill index.
    int32_t bfidx = 0;

    // Character value.
    int8_t cv = 33;

    // Fill the buffer with printable characters.
    for (; bfidx < blocksize; bfidx++, cv++)
    {
        // Verify the character value is in range.
        if (cv >= 127)
        {
            cv = 33;
        }
        else
        {
            // Add to the buffer.
            buf[bfidx] = cv;
        }
    }

    // Open the file.
    fd = open (fname.c_str (), O_WRONLY | O_CREAT, 0660);

    // Verify the file has been opened.
    if (fd == -1)
    {
        cout << get_datetime_string() << "Write open of " << fname 
        << " failed.  Errno: " << errno << endl;
    }
    else
    {
        // Total bytes written.
        uint64_t written = 0;

        // Notify the start of the test.
        cout << get_datetime_string() << "Write test started" << endl;

        // Elapsed time.
        struct timeval tv = { 0 };
        get_elapsed_time (&tv);
        struct timeval write_tv = tv;

        // Run until it is time for the test to stop.
        while (written < READ_LIMIT && zero_writes < 10)
        {
            ssize_t writesize = write (fd, &buf[0], blocksize);
            if (writesize == -1)
            {
                cout << get_datetime_string << "Write failure.  Errno: " << errno << endl;
                zero_writes = 10;
            }
            else if (0 == writesize)
            {
                cout << get_datetime_string() << "Zero bytes written" << endl;
                zero_writes++;
            }
            else
            {
                written += writesize;
            }
        }

    string flush_command = "nvme flush /dev/nvme0n1p";
    flush_command += fname[9];
    system(flush_command.c_str());


    // Get the elapsed time.
    get_elapsed_time (&write_tv);

    // Report the number of bytes written.
    cout << get_datetime_string() << "Write " << written << " bytes in "
     << write_tv.tv_sec << "." << write_tv.tv_usec
     << " seconds" << endl;

    // Close the file.
    close (fd);

    // Get the elapsed time.
    get_elapsed_time (&tv);

    // Report the number of bytes read.
    cout << get_datetime_string() << "Write closed.  " << written 
    << " Bytes written in " << tv.tv_sec << "." << tv.tv_usec 
    << " seconds" << endl;

    // Report the number of bytes per second.
    cout << get_datetime_string() << "Bytes per second " 
    << bytes_per_second (&tv, written) << endl;

    // Report the cache flush time.
    struct timeval flush_tv = { 0 };
    timersub (&tv, &write_tv, &flush_tv);
    cout << get_datetime_string() << "System cache flush completed in " 
    << flush_tv.tv_sec << "." << flush_tv.tv_usec << "seconds" << endl;

    // Set the function return status when all write operations have
    // been successful.
    if (zero_writes < 10)
    {
      status = true;
    }
  }
  return status;
}

Os dados que estou recebendo são assim insira a descrição da imagem aqui

Os números estão próximos do rendimento teórico máximo do Samsung 950 Pro, mas alguns são muito altos e isso me incomoda. Por que posso estar obtendo números superiores ao rendimento máximo teórico do Samsung 950 Pro?

informação relacionada