data:image/s3,"s3://crabby-images/f9d26/f9d267cc8408077e602cd84ab7f95f5a83ed31ff" alt="odt2txt がページ区切りを正しく処理しない"
また、何か間違ったことをしているのか、バグなのかもわかりません。
bash コマンド odt2txt を使用して、Libreoffice Writer で作成された odt ファイルをテキスト ファイルに変換したいのですが、改行が正しく処理されていないようです。1 つの改行はすべて 2 つの改行に変換され、複数の改行も 2 つの改行に変換されます。
例えばこれを保存した場合
This is a test
one line break before this
two line breaks before this
and three line breaks before this
LO Writerでtest.odtにコピーし、
odt2txt test.odt
私は
This is a test
one line break before this
two line breaks before this
and three line breaks before this
いずれのオプションを使用しても、私には役に立ちませんでした。
Google でこれについて何も見つからないので、この問題を抱えているのは私だけなのかなと思います。
更新: コメントで求められた cat -vet output.txt からの出力
$
This is a test$
$
one line break before this$
$
two line breaks before this$
$
and three line breaks before this$
$