Когда вы хотите быстро взглянуть на распределение последовательности значений, график «стебель-и-листья» — невероятно простой, но мощный инструмент. Потребуется несколько минут, чтобы научить компьютер рисовать его, или вы можете тривиально сделать это вручную.
Единственная проблема в том, что он не сохраняет порядок значений, который иногда содержит полезную информацию. Я пытался придумать такой же простой способ построения временного ряда с сохраненным порядком, но ничего не получилось.
Очевидное решение создания обычной временной диаграммы с временем на оси X и значениями на оси Y страдает от проблемы, что требуется довольно много подготовительной работы перед тем, как приступить к фактическому рендерингу. Это далеко не так концептуально просто, как диаграмма «стебель и листья».
Есть ли что-то, что есть? Или то, о чем я прошу, невозможно?
О, и еще одно важное требование, о котором я чуть не забыл: я бы хотел, чтобы это можно было легко распечатать на терминале с буферизацией строк...
Причина, по которой я спрашиваю здесь, заключается в том, что мой основной вариант использования этого — показатели работоспособности и другие образцы с серверов. При исключении причин неисправной системы было бы неплохо быстро получить интуицию о том, как некоторая подсистема вела себя с течением времени.
решение1
Я не уверен, что это именно то, что я ищу, поскольку это немного сложно, но пока что это удовлетворяет моим потребностям:
Я начал работать с температурами, которые удобно находились в диапазоне 25–60 °C, поэтому я мог просто воспроизвести строку, *
чтобы создать своего рода столбчатую диаграмму из них:
$ cat temps2.txt | perl -pe 'print "*" x $_ . " ";'
******************************************** 44.0
*************************************************** 51.0
******************************************* 43.0
********************************************* 45.0
************************************** 38.0
**************************************** 40.0
*********************************** 35.0
************************************ 36.0
******************************** 32.0
******************************** 32.0
******************************* 31.0
******************************* 31.0
******************************** 32.0
******************************** 32.0
******************************* 31.0
************************************ 36.0
******************************** 32.0
************************************ 36.0
******************************* 31.0
*********************************** 35.0
************************************ 36.0
************************************ 36.0
********************************* 33.0
******************************* 31.0
******************************** 32.0
******************************* 31.0
********************************* 33.0
******************************** 32.0
******************************** 32.0
************************************ 36.0
Конечно, это работает только со значениями, которые находятся в удобном диапазоне, но это чертовски эффективно, когда это так, а когда это не так, можно просто добавить некоторые арифметические манипуляции к переменной, $_
указывающей количество повторений.
Например, среднюю длину очереди выполнения процессора в секунду (которая у меня находится в диапазоне 0–8) можно умножить на 10, чтобы увидеть сдвиги в выходных данных:
$ cat runq.txt | perl -pe 'print "*" x ($_ * 10) . " ";'
0
0
0
0
******************** 2
********** 1
******************** 2
**************************************** 4
****************************** 3
**************************************** 4
****************************** 3
****************************** 3
******************** 2
******************** 2
********** 1
********** 1
********** 1
************************************************************ 6
********** 1
********** 1
********** 1
0
0
Это полностью удовлетворило бы мои потребности.
Конечно, я, как и все, переборщил и создал большой скрипт, включающий автоматический расчет и обновление преобразований координат, а также потоковое вычисление средних значений системы и пределов естественного процесса:
$ cat temps2.txt | ./limits.pl
----------------------------------------------------------------
X: 51.0 [ | * ]
X: 43.0 [ * | ]
X: 45.0 [ | ]
X: 38.0 [ * | ]
X: 40.0 [ * | ]
X: 35.0 [ * | ]
X: 36.0 [ * | ]
X: 32.0 [ * | ]
X: 32.0 [ * | ]
X: 31.0 [* | ]
X: 31.0 [* | ]
X: 32.0 [ * | ]
X: 32.0 [ * | ]
X: 31.0 [* | ]
X: 36.0 [ * ]
X: 32.0 [ * | ]
X: 36.0 [ | ]
X: 31.0 [ * | ]
X: 35.0 [ *| ]
X: 36.0 [ | ]
X: 36.0 [ * ]
X: 33.0 [ * | ]
X: 31.0 [ * | ]
X: 32.0 [ * | ]
X: 31.0 [ * | ]
X: 33.0 [ *| ]
X: 32.0 [ * | ]
X: 32.0 [ * | ]
X: 36.0 [ |* ]
UPL=42.1
Xbar=35.2
LPL=28.2
Нечистый исходный код этого скрипта также прилагается. Это первый черновик, поэтому извините за плохой код.
#!/usr/bin/env perl
use v5.26;
use strict;
use warnings;
use List::Util qw( min max );
my $max_width = 52;
my $n = 0;
my $xbar = 0;
my $mrbar = 0;
my $lpl;
my $upl;
sub print_values {
print "\n";
printf "UPL=%.1f\n", $upl;
printf "Xbar=%.1f\n", $xbar;
printf "LPL=%.1f\n", $lpl;
}
$SIG{INT} = \&print_values;
my $min_y;
my $max_y;
my $xprev;
while (my $x = <>) {
$n++;
$xbar *= $n - 1;
$xbar += $x;
$xbar /= $n;
if (defined($xprev)) {
my $mr = abs ($x - $xprev);
$mrbar *= $n - 2;
$mrbar += $mr;
$mrbar /= $n - 1;
$lpl = $xbar - $mrbar * 2.66;
$upl = $xbar + $mrbar * 2.66;
my $space_changed;
# If any point is about to be drawn outside of the screen space, expand
# the space to include the currently drawn points and then some.
if (min($lpl, $x) < $min_y or max($upl, $x) > $max_y) {
my $min_diff = abs($min_y - min($lpl, $x));
my $max_diff = abs($max_y - max($upl, $x));
# Change min and max values in slightly larger steps to avoid
# changing the space too often with a drifting process.
$min_y -= $min_diff * 2;
$max_y += $max_diff * 2;
$space_changed = 1;
}
if ($min_y == $max_y) {
$max_y = $min_y + 1;
}
my %screen_coords;
$screen_coords{lpl} = $lpl;
$screen_coords{upl} = $upl;
$screen_coords{xbar} = $xbar;
$screen_coords{x} = $x;
# Transform the recorded values to the screen space.
for my $coord (keys %screen_coords) {
# Set offset to 0.
$screen_coords{$coord} -= $min_y;
# Divide by range to scale down to 0–1.
$screen_coords{$coord} /= ($max_y - $min_y);
# Scale up again to proper width.
$screen_coords{$coord} *= ($max_width - 1);
}
# Render the recorded values into an array of characters.
my @characters = split('', ' ' x $max_width);
$characters[$screen_coords{xbar}] = '|';
$characters[$screen_coords{lpl}] = '[';
$characters[$screen_coords{upl}] = ']';
$characters[$screen_coords{x}] = '*';
# Print a separator whenever the space needs to be expanded.
if ($space_changed) {
printf ('-' x ($max_width + 12) . "\n");
}
printf "X: %7.1f %s\n", $x, join('', @characters);
} else {
$min_y = $x;
$max_y = $x;
}
$xprev = $x;
}
print_values;