Linux の標準ストリームにおける単一の「アトム」とは正確には何ですか?

Question

基本的に、パイプ/ファイル/ソケット、または接続したstdin/stdout/stderrはストリーム(*)です。バイト関連するシステムコールはread()とでありwrite()、それらの POSIX の説明では次のように述べられています。

write() 関数は、buf が指すバッファから nbyte バイトをファイルに書き込もうとします [...]

そして

read() 関数は、開いているファイル記述子 fildes に関連付けられたファイルから nbyte バイトを読み取ろうとします。[...]

したがって、8 ビットバイトは、一度に読み書きできる最小単位であり、いわば「アトム」です。

しかし、さまざまなユーティリティが何を行うかは別の問題です。readデフォルトではは 1 行を読み取りますが、ライブラリ関数も同様ですfgets()。シェルによっては、代わりに固定数のバイトを読み取るように要求できる場合がありますread。たとえば、Bash の場合:

$ echo foo | ( read -n 1 a; echo "first: $a"; read -n 1 b; echo "second: $b" )
first: f
second: o

ただし、Bashはreadロケールに従ってカウントを次のように取ることに注意してください。文字、マルチバイトの可能性があります。しかし、それは個々の文字を読み取ることを妨げるものではありません。バイトその代わり：

$ echo äöä | (read -n 1 a; echo "first: $a"; LC_ALL=C read -n 1 b; echo "second: $b" )
first: ä
second: �

（* もありますデータグラムソケットはバイト単位ですが、メッセージ(0 バイト以上の) がソケットに送信されます。適切に設定されたデータグラムソケットを stdin/stdout/stderr に接続することもできますが、実際にそうする人はほとんどいません。

Answer 1