Bash — как добавить строку в начало текстового файла, не считывая его полностью?

Question 1

Вы утверждаете, что последовательность команд, которые вы использовали, была следующей:

echo "hello world" > test.txt;
echo "the large content that size is 1gb" >> test.txt;
sed -i ':a;N;$!ba;s/\n//g' test.txt;

Я предполагаю, что команды на самом деле были такими:

echo "hello world" > newfile;
cat test.txt >> newfile;            # assuming the file with 1GigaByte was test.txt

И вы жалуетесь на команду sed, которая предназначена только для удаления новых строк (из вашего описания).

То же самое можно сделать с помощью tr, который не использует (много) памяти:

echo "hello world" > newfile;
cat test.txt | tr -d '\n' >> newfile

И newfileбудет иметь копию test.txt с добавленным в начало "hello world".

Answer

Вы утверждаете, что последовательность команд, которые вы использовали, была следующей:

echo "hello world" > test.txt;
echo "the large content that size is 1gb" >> test.txt;
sed -i ':a;N;$!ba;s/\n//g' test.txt;

Я предполагаю, что команды на самом деле были такими:

echo "hello world" > newfile;
cat test.txt >> newfile;            # assuming the file with 1GigaByte was test.txt

И вы жалуетесь на команду sed, которая предназначена только для удаления новых строк (из вашего описания).

То же самое можно сделать с помощью tr, который не использует (много) памяти:

echo "hello world" > newfile;
cat test.txt | tr -d '\n' >> newfile

И newfileбудет иметь копию test.txt с добавленным в начало "hello world".

Question 2

sedне использует много памяти. Однако ОС может кэшировать диск. Поэтому использование nocacheможет помочь (если диск достаточно быстрый или вы не считываете одни и те же данные более одного раза). И/или используйте опцию --unbuffered( sedчтобы sedReli использовал как можно меньше памяти).

Также не может быть опции echo, как >>это делает оболочка, а не команда. Она сообщает оболочке, что нужно добавить stdout команды в файл.

И как говорит @Kusalananda, ваш sedскрипт неэффективен. Я бы, наверное, просто использовал cat.

uncache cat "<(echo the_prefix)" old_file_name > new_file_name
rm old_file_name
mv -T new_file_name old_file_name #note not all `mv`s have the `-T` option, it can unsafely be left out.

Answer

sedне использует много памяти. Однако ОС может кэшировать диск. Поэтому использование nocacheможет помочь (если диск достаточно быстрый или вы не считываете одни и те же данные более одного раза). И/или используйте опцию --unbuffered( sedчтобы sedReli использовал как можно меньше памяти).

Также не может быть опции echo, как >>это делает оболочка, а не команда. Она сообщает оболочке, что нужно добавить stdout команды в файл.

И как говорит @Kusalananda, ваш sedскрипт неэффективен. Я бы, наверное, просто использовал cat.

uncache cat "<(echo the_prefix)" old_file_name > new_file_name
rm old_file_name
mv -T new_file_name old_file_name #note not all `mv`s have the `-T` option, it can unsafely be left out.

Question 3

А как насчет чего-нибудь попроще?

cat <<_eof_ > file
Hello world!
$(cat file)
_eof_

Или используйте ed

echo '0a
your text here
.
w' | ed some_file

Answer

А как насчет чего-нибудь попроще?

cat <<_eof_ > file
Hello world!
$(cat file)
_eof_

Или используйте ed

echo '0a
your text here
.
w' | ed some_file

Question 4

Если это убивает вашу память:

sed -i ':a;N;$!ba;s/\n//g' "test.txt"

затем, чтобы удалить новые строки и читать только по одной, попробуйте:

{
    printf "hello world"  # with no newline
    while IFS= read -r line || [ -n "$line" ]; do
        printf "%s" "$line"
    done < test.txt
    echo ""          # add a newline to the end of the file
} > test.txt.tmp && mv test.txt{.tmp,}

В обычных обстоятельствах это будет немного медленнее, чем sed, но ваша ситуация нестандартная.

Answer

Если это убивает вашу память:

sed -i ':a;N;$!ba;s/\n//g' "test.txt"

затем, чтобы удалить новые строки и читать только по одной, попробуйте:

{
    printf "hello world"  # with no newline
    while IFS= read -r line || [ -n "$line" ]; do
        printf "%s" "$line"
    done < test.txt
    echo ""          # add a newline to the end of the file
} > test.txt.tmp && mv test.txt{.tmp,}

В обычных обстоятельствах это будет немного медленнее, чем sed, но ваша ситуация нестандартная.

Bash — как добавить строку в начало текстового файла, не считывая его полностью?

решение1

решение2

решение3

решение4

Связанный контент