есть ли что-то вроде графика «стебель и листья» для временных рядов?

есть ли что-то вроде графика «стебель и листья» для временных рядов?

Когда вы хотите быстро взглянуть на распределение последовательности значений, график «стебель-и-листья» — невероятно простой, но мощный инструмент. Потребуется несколько минут, чтобы научить компьютер рисовать его, или вы можете тривиально сделать это вручную.

Единственная проблема в том, что он не сохраняет порядок значений, который иногда содержит полезную информацию. Я пытался придумать такой же простой способ построения временного ряда с сохраненным порядком, но ничего не получилось.

Очевидное решение создания обычной временной диаграммы с временем на оси X и значениями на оси Y страдает от проблемы, что требуется довольно много подготовительной работы перед тем, как приступить к фактическому рендерингу. Это далеко не так концептуально просто, как диаграмма «стебель и листья».

Есть ли что-то, что есть? Или то, о чем я прошу, невозможно?

О, и еще одно важное требование, о котором я чуть не забыл: я бы хотел, чтобы это можно было легко распечатать на терминале с буферизацией строк...


Причина, по которой я спрашиваю здесь, заключается в том, что мой основной вариант использования этого — показатели работоспособности и другие образцы с серверов. При исключении причин неисправной системы было бы неплохо быстро получить интуицию о том, как некоторая подсистема вела себя с течением времени.

решение1

Я не уверен, что это именно то, что я ищу, поскольку это немного сложно, но пока что это удовлетворяет моим потребностям:

Я начал работать с температурами, которые удобно находились в диапазоне 25–60 °C, поэтому я мог просто воспроизвести строку, *чтобы создать своего рода столбчатую диаграмму из них:

$ cat temps2.txt | perl -pe 'print "*" x $_ . " ";'
******************************************** 44.0
*************************************************** 51.0
******************************************* 43.0
********************************************* 45.0
************************************** 38.0
**************************************** 40.0
*********************************** 35.0
************************************ 36.0
******************************** 32.0
******************************** 32.0
******************************* 31.0
******************************* 31.0
******************************** 32.0
******************************** 32.0
******************************* 31.0
************************************ 36.0
******************************** 32.0
************************************ 36.0
******************************* 31.0
*********************************** 35.0
************************************ 36.0
************************************ 36.0
********************************* 33.0
******************************* 31.0
******************************** 32.0
******************************* 31.0
********************************* 33.0
******************************** 32.0
******************************** 32.0
************************************ 36.0

Конечно, это работает только со значениями, которые находятся в удобном диапазоне, но это чертовски эффективно, когда это так, а когда это не так, можно просто добавить некоторые арифметические манипуляции к переменной, $_указывающей количество повторений.

Например, среднюю длину очереди выполнения процессора в секунду (которая у меня находится в диапазоне 0–8) можно умножить на 10, чтобы увидеть сдвиги в выходных данных:

$ cat runq.txt | perl -pe 'print "*" x ($_ * 10) . " ";'
 0
 0
 0
 0
******************** 2
********** 1
******************** 2
**************************************** 4
****************************** 3
**************************************** 4
****************************** 3
****************************** 3
******************** 2
******************** 2
********** 1
********** 1
********** 1
************************************************************ 6
********** 1
********** 1
********** 1
 0
 0

Это полностью удовлетворило бы мои потребности.


Конечно, я, как и все, переборщил и создал большой скрипт, включающий автоматический расчет и обновление преобразований координат, а также потоковое вычисление средних значений системы и пределов естественного процесса:

$ cat temps2.txt | ./limits.pl
----------------------------------------------------------------
X:    51.0           [            | *         ]
X:    43.0         [           * |            ]
X:    45.0            [         |          ]
X:    38.0          [      *   |          ]
X:    40.0           [      *  |        ]
X:    35.0           [   *    |        ]
X:    36.0           [    *  |        ]
X:    32.0           [ *     |       ]
X:    32.0           [ *    |      ]
X:    31.0           [*     |     ]
X:    31.0           [*    |     ]
X:    32.0           [ *   |     ]
X:    32.0           [ *   |    ]
X:    31.0           [*   |    ]
X:    36.0           [    *     ]
X:    32.0           [ *  |     ]
X:    36.0          [     |     ]
X:    31.0          [ *   |     ]
X:    35.0          [    *|     ]
X:    36.0          [     |    ]
X:    36.0          [     *    ]
X:    33.0          [   * |    ]
X:    31.0          [ *   |    ]
X:    32.0          [  * |     ]
X:    31.0          [ *  |    ]
X:    33.0          [   *|    ]
X:    32.0          [  * |    ]
X:    32.0          [  * |    ]
X:    36.0          [    |*   ]
UPL=42.1
Xbar=35.2
LPL=28.2

Нечистый исходный код этого скрипта также прилагается. Это первый черновик, поэтому извините за плохой код.

#!/usr/bin/env perl

use v5.26;
use strict;
use warnings;
use List::Util qw( min max );

my $max_width = 52;

my $n = 0;
my $xbar = 0;
my $mrbar = 0;
my $lpl;
my $upl;

sub print_values {
    print "\n";
    printf "UPL=%.1f\n", $upl;
    printf "Xbar=%.1f\n", $xbar;
    printf "LPL=%.1f\n", $lpl;
}

$SIG{INT} = \&print_values;

my $min_y;
my $max_y;

my $xprev;
while (my $x = <>) {
    $n++;
    $xbar *= $n - 1;
    $xbar += $x;
    $xbar /= $n;

    if (defined($xprev)) {
        my $mr = abs ($x - $xprev);
        $mrbar *= $n - 2;
        $mrbar += $mr;
        $mrbar /= $n - 1;

        $lpl = $xbar - $mrbar * 2.66;
        $upl = $xbar + $mrbar * 2.66;

        my $space_changed;

        # If any point is about to be drawn outside of the screen space, expand
        # the space to include the currently drawn points and then some.
        if (min($lpl, $x) < $min_y or max($upl, $x) > $max_y) {
            my $min_diff = abs($min_y - min($lpl, $x));
            my $max_diff = abs($max_y - max($upl, $x));
            # Change min and max values in slightly larger steps to avoid
            # changing the space too often with a drifting process.
            $min_y -= $min_diff * 2;
            $max_y += $max_diff * 2;
            $space_changed = 1;
        }
        if ($min_y == $max_y) {
            $max_y = $min_y + 1;
        }

        my %screen_coords;
        $screen_coords{lpl} = $lpl;
        $screen_coords{upl} = $upl;
        $screen_coords{xbar} = $xbar;
        $screen_coords{x} = $x;

        # Transform the recorded values to the screen space.
        for my $coord (keys %screen_coords) {
            # Set offset to 0.
            $screen_coords{$coord} -= $min_y;
            # Divide by range to scale down to 0–1.
            $screen_coords{$coord} /= ($max_y - $min_y);
            # Scale up again to proper width.
            $screen_coords{$coord} *= ($max_width - 1);
        }

        # Render the recorded values into an array of characters.
        my @characters = split('', ' ' x $max_width);
        $characters[$screen_coords{xbar}] = '|';
        $characters[$screen_coords{lpl}] = '[';
        $characters[$screen_coords{upl}] = ']';
        $characters[$screen_coords{x}] = '*';

        # Print a separator whenever the space needs to be expanded.
        if ($space_changed) {
            printf ('-' x ($max_width + 12) . "\n");
        }

        printf "X: %7.1f %s\n", $x, join('', @characters);
    } else {
        $min_y = $x;
        $max_y = $x;
    }

    $xprev = $x;
}

print_values;

Связанный контент