
我真的很喜歡hexdump
,特別是因為你可以定義自訂格式;說:
$ echo -e '\x00\x01\x02\x03' | hexdump -v -e '1/1 "%_ad: "' -e '4/1 "%02X "' -e '1/1 " : "' -e '4/1 "%_p"' -e '1/1 "\n"'
0: 00 01 02 03 : ....
4: 0A : .
因此,我可以選擇每行 4 個位元組,首先寫為十六進制,然後寫為字元。但是,我在這裡缺少的是“二進位字串”(或“位元字串”)格式化字元;例如我想-e '4/1 "%08b "'
在命令列中的某個地方寫一些東西,然後得到,例如:
0: 00 01 02 03 : 00000000 00000001 00000010 00000011 : ....
4: 0A : 00001010 : .
當然,那麼可能必須指定字節序(如果應該格式化超過一個位元組的群組)等...但無論如何,根據我在手冊中看到的,這種格式不hexdump
存在。
所以我的問題是 - 我在 Linux 命令列上有什麼替代方案,以便我可以獲得包含上述二進位字串的格式化轉儲,但最大程度地保留程式的可自訂性hexdump
(就位元組分組而言) )當使用它的-e
選項時?
答案1
如果轉儲程式無法使用合適的轉儲選項,您始終可以透過使用兩者來拼湊一些內容hexdump
,xdd
然後使用貼上將輸出連接起來。它不太漂亮,但是使用支援進程替換的 shell(bash
就可以了):
mkfifo fifo
echo -e '\x00\x01\x02\x03' |
tee fifo |
paste -d' ' \
<(hexdump -v -e '1/1 "%_ad: "' -e '4/1 "%02X "' -e '1/1 " :\n"') \
<(xxd -b -c 4 fifo | cut -d' ' -f 2-)
輸出:
0: 00 01 02 03 : 00000000 00000001 00000010 00000011 ....
4: 0A : 00001010 .
答案2
這是我使用 Perl 的建議,利用pack()
/unpack()
函數的格式說明符;測試調用如下:
$ echo -e '\x00\x01\x02\x03' | perl hexdump-00.pl --offset 120 --group 4 --add '(H2)*' --add '(B8)*'
Opening '' STDIN
Cannot seek!
0
00000000: 00 01 02 03 00000000 00000001 00000010 00000011 '....'
00000004: 0a 00001010 '.'
在中間插入字串標記有點困難 - 但好處是,您仍然可以在其中「分組」位元組 - 例如,您可以將兩個位元組分組並將它們解釋為有符號(短)整數,例如:
$ perl -e 'print pack("s*\n", (-124))' | hexdump -C
00000000 84 ff |..|
00000002
$ echo -e '\x00\x01\x84\xff' | perl hexdump.pl \
--offset 120 --group 4 \
--add '(H2)*' \
--add '(B8)*' \
--add '(s2)*'
Opening '' STDIN
Cannot seek!
0
00000000: 00 01 84 ff 00000000 00000001 10000100 11111111 256 -124 '....'
00000004: 0a 00001010 '.'
這是hexdump-00.pl
:
#!/usr/bin/perl
# perl hexdump-00.pl --offset 120 --group 4 --add '(H2)*' --add '(B8)*' test.file
use strict;
use warnings;
use Getopt::Long;
use Fcntl qw(SEEK_CUR SEEK_SET);
my $offset = 0;
my $groupsize = 1;
my $length = 128;
my @list=();
my $result = GetOptions (
"offset=i" => \$offset,
"group=i" => \$groupsize,
"length=i" => \$length,
"add=s" => \@list,
);
my $inputfname="";
my $inputfh;
$inputfname = $ARGV[0] if defined $ARGV[0];
if (($inputfname eq "") || ($inputfname eq "-")) {
printf(STDERR "Opening '%s' STDIN\n", $inputfname);
$inputfh = *STDIN;
} else {
printf(STDERR "Opening '%s'\n", $inputfname);
open ($inputfh, "<$inputfname");
}
binmode($inputfh);
my $startaddr=0;
if( not(defined($startaddr = sysseek($inputfh, $offset-1, SEEK_SET))) ) {
printf(STDERR "Cannot seek!\n");
#~ $startaddr = sysseek($inputfh, 0, 0); // cannot reset like this
$startaddr = 0; # just avoid errors
}
print(STDERR $startaddr . "\n");
my $buffer=undef;
my $nread;
my $total=0;
while (($nread=sysread($inputfh, $buffer, $groupsize)) > 0) { # , $startaddr
#~ printf("%08X: nr: %d, buf '%s'\n",$startaddr,$nread,$buffer);
printf("%08X: ", $startaddr);
foreach my $tformat (@list) {
foreach my $tentry (unpack($tformat, $buffer)) {
printf("%s ", $tentry);
}
}
(my $newbuf = $buffer) =~ s/[^[:print:]]/./g; # make non-printable into '.'
printf(" '%s'", $newbuf);
print("\n");
$startaddr += $nread;
$total += $nread;
if ($total > $length) { last; }
}
close($inputfh);
答案3
以下是一些sed
可以將的輸出dc
轉換為基數 2 的內容:od
od -t d1z -w4 -v -N12 </dev/urandom |
sed -e '1i2o' -e 's/.*/[&]p/p;$d
s/>/]n [>/;s/[^ ]*/&]n [/;h;s/>.*//;
s/ -/ _/g;s/ [^] [][^ ]*/ ]n&n [ /g;G
s/\n[^>]*//' |
dc
現在有點簡單了——更不用說更快了——但它仍然不是選美皇后。它還會列印所有位元組的十進制值和以 2 為底的值。
當我運行它時,我得到:
0000000 -43 125 -117 -39 >.}..<
0000000 -101011 1111101 -1110101 -100111 >.}..<
0000004 62 28 80 61 >>.P=<
0000004 111110 11100 1010000 111101 >>.P=<
0000010 6 14 120 -16 >..x.<
0000010 110 1110 1111000 -10000 >..x.<
0000014
或者...
echo aBcD | od -t d1z -w4 -v | sed ... | dc
0000000 97 66 99 68 >aBcD<
0000000 1100001 1000010 1100011 1000100 >aBcD<
0000004 10 >.<
0000004 1010 >.<
0000005
字段寬度可能需要一些工作,但這都是你的。你不需要這個-N12
選項——我只是使用了這個選項,這樣我就不會被無休無止的偽隨機數據所窒息。並且-w4
指定每行 4 個字節,但您應該能夠使用任意數量的位元組。此外,該1i2o
sed
命令是dc
關於其輸出基數的指令 -2
對於二進位 - 但 2 到 16 之間的任何基數都應該可以正常工作。例如,如果您希望查看十六進位和基數 2 的輸出,您需要將「16i」新增到第一個sed
語句中,並將od
的-t d1z
選項變更為t x1z
。
其他選項包括...
printf 這樣做:
printf '%o\n%x\n' 128 128
200
80
....甚至...
printf '%o\n%x\n' "'a" "'a"
141
61
二進制並不那麼簡單,但如果您將其設定為您的規範,bc
則可以完成所有操作:obase=
printf 'obase=2;%d
obase=8;%d
obase=16;%d
obase=2;%d
' 64 128 "'A" "'a" |
bc
輸出
1000000
200
41
1100001
dc
不太健談:
printf '%do%dn10P' 2 64 8 128 16 "'A" 2 "'a" |dc
輸出
1000000
200
41
1100001
獲取man dc bc
更多資訊。
再說一遍,對於文件流,您始終可以使用od
:
for o in o d x ; do
echo aBcD |
od -A n -t ${o}1z -v -w4
done
輸出
141 102 143 104 >aBcD<
012 >.<
97 66 99 68 >aBcD<
10 >.<
61 42 63 44 >aBcD<
0a >.<
和^那個^我告訴od
不要打印偏移量 - 我現在正在猜測 - 我想要-t
ype o
、d
或x
一次一個字節的輸出,並且我想要將每個字節的 ASCII 表示z
附加到行尾,-v
erbosely(所以它不只是印我一個0*
for 0000
)每行位元組數-w4
。
如果沒有-A n
它列印:
0000000 141 102 143 104 >aBcD<
0000004 012 >.<
0000005
0000000 97 66 99 68 >aBcD<
0000004 10 >.<
0000005
0000000 61 42 63 44 >aBcD<
0000004 0a >.<
0000005
當然,在 . 中任何組合dc
bc
od
都是可能的|pipeline
。