О `fork`, дочерних процессах и "подоболочках"

Question 1

Так как, согласно zshall(1), $ZDOTDIR/.zshenv становится источником всякий раз, когда запускается новый экземпляр zsh

Если вы сосредоточитесь на слове "начинается" здесь, у вас будет лучшее время вещей. Эффект заключается fork()в создании другого процессакоторый начинается именно там, где уже находится текущий процесс. Это клонирование существующего процесса, с единственным отличием в возвращаемом значении fork. В документации используется «starts» для обозначения входа в программу с самого начала.

Ваш пример №3 запускает $SHELL -c 'date; printenv; echo $$', запуская совершенно новый процесс с самого начала. Он пройдет через обычное поведение запуска. Вы можете проиллюстрировать это, например, заменив другую оболочку: run bash -c ' ... 'вместо zsh -c ' ... '. В использовании здесь нет ничего особенного $SHELL.

Примеры № 1 и № 2 запускают подоболочки. Оболочка forkсама по себе и выполняет ваши команды внутри этого дочернего процесса, а затем продолжает свое собственное выполнение, когда дочерний процесс завершается.

Ответ на ваш вопрос №1 приведен выше: пример 3 запускает совершенно новую оболочку с самого начала, в то время как два других запускают подоболочки. Поведение при запуске включает загрузку .zshenv.

Причина, по которой они специально описывают это поведение (что, вероятно, и приводит вас в замешательство), заключается в том, что этот файл (в отличие от некоторых других) загружается как в интерактивных, так и в неинтерактивных оболочках.

На ваш вопрос №2:

если оболочки, созданные в #1 и #2, называются «подоболочками», как называются те, что созданы в #3?

Если вам нужно имя, вы можете назвать его "дочерней оболочкой", но на самом деле это ничто. Это ничем не отличается от любого другого процесса, который вы запускаете из оболочки, будь то та же самая оболочка, другая оболочка или cat.

На ваш вопрос №3:

возможно ли рационализировать (а может быть, и обобщить) эмпирические/анекдотические выводы, описанные выше, в терминах «теории» (за неимением лучшего слова) процессов Unix?

forkсоздает новый процесс с новым PID, который начинает работать параллельно с того места, где остановился предыдущий.execзаменяет текущий исполняемый код новой программой, загруженной откуда-то, работающей с самого начала. Когда вы порождаете новую программу, сначала вы forkсами, а затем execэта программа в потомке. Это фундаментальная теория процессов, которая применяется везде, внутри и снаружи оболочек.

Подоболочки — это forks, и каждая не встроенная команда, которую вы запускаете, приводит как к a, так forkи к exec.

Обратите внимание, что это $$расширяется до PID родительской оболочки.в любой POSIX-совместимой оболочке, поэтому вы можете не получить ожидаемый вывод в любом случае. Обратите внимание также, что zsh в любом случае агрессивно оптимизирует выполнение подоболочки и обычно execs является последней командой или вообще не порождает подоболочку, если все команды безопасны без нее.

Вот полезная команда для проверки вашей интуиции:

strace -e trace=process -f $SHELL -c ' ... '

Это выведет в стандартную ошибку все события, связанные с процессом (и никаких других) для команды, которую ...вы запускаете в новой оболочке. Вы можете увидеть, что выполняется и не выполняется в новом процессе, и где execпроисходят s.

Другая потенциально полезная команда — pstree -h, которая выведет и выделит дерево родительских процессов текущего процесса. Вы можете увидеть, на скольких уровнях вы находитесь в выводе.

Answer

Так как, согласно zshall(1), $ZDOTDIR/.zshenv становится источником всякий раз, когда запускается новый экземпляр zsh

Если вы сосредоточитесь на слове "начинается" здесь, у вас будет лучшее время вещей. Эффект заключается fork()в создании другого процессакоторый начинается именно там, где уже находится текущий процесс. Это клонирование существующего процесса, с единственным отличием в возвращаемом значении fork. В документации используется «starts» для обозначения входа в программу с самого начала.

Ваш пример №3 запускает $SHELL -c 'date; printenv; echo $$', запуская совершенно новый процесс с самого начала. Он пройдет через обычное поведение запуска. Вы можете проиллюстрировать это, например, заменив другую оболочку: run bash -c ' ... 'вместо zsh -c ' ... '. В использовании здесь нет ничего особенного $SHELL.

Примеры № 1 и № 2 запускают подоболочки. Оболочка forkсама по себе и выполняет ваши команды внутри этого дочернего процесса, а затем продолжает свое собственное выполнение, когда дочерний процесс завершается.

Ответ на ваш вопрос №1 приведен выше: пример 3 запускает совершенно новую оболочку с самого начала, в то время как два других запускают подоболочки. Поведение при запуске включает загрузку .zshenv.

Причина, по которой они специально описывают это поведение (что, вероятно, и приводит вас в замешательство), заключается в том, что этот файл (в отличие от некоторых других) загружается как в интерактивных, так и в неинтерактивных оболочках.

На ваш вопрос №2:

если оболочки, созданные в #1 и #2, называются «подоболочками», как называются те, что созданы в #3?

Если вам нужно имя, вы можете назвать его "дочерней оболочкой", но на самом деле это ничто. Это ничем не отличается от любого другого процесса, который вы запускаете из оболочки, будь то та же самая оболочка, другая оболочка или cat.

На ваш вопрос №3:

возможно ли рационализировать (а может быть, и обобщить) эмпирические/анекдотические выводы, описанные выше, в терминах «теории» (за неимением лучшего слова) процессов Unix?

forkсоздает новый процесс с новым PID, который начинает работать параллельно с того места, где остановился предыдущий.execзаменяет текущий исполняемый код новой программой, загруженной откуда-то, работающей с самого начала. Когда вы порождаете новую программу, сначала вы forkсами, а затем execэта программа в потомке. Это фундаментальная теория процессов, которая применяется везде, внутри и снаружи оболочек.

Подоболочки — это forks, и каждая не встроенная команда, которую вы запускаете, приводит как к a, так forkи к exec.

Обратите внимание, что это $$расширяется до PID родительской оболочки.в любой POSIX-совместимой оболочке, поэтому вы можете не получить ожидаемый вывод в любом случае. Обратите внимание также, что zsh в любом случае агрессивно оптимизирует выполнение подоболочки и обычно execs является последней командой или вообще не порождает подоболочку, если все команды безопасны без нее.

Вот полезная команда для проверки вашей интуиции:

strace -e trace=process -f $SHELL -c ' ... '

Это выведет в стандартную ошибку все события, связанные с процессом (и никаких других) для команды, которую ...вы запускаете в новой оболочке. Вы можете увидеть, что выполняется и не выполняется в новом процессе, и где execпроисходят s.

Другая потенциально полезная команда — pstree -h, которая выведет и выделит дерево родительских процессов текущего процесса. Вы можете увидеть, на скольких уровнях вы находитесь в выводе.

Question 2

Когда в руководстве говорится, что команды в .zshenv"sourced", это означает, что они выполняются в оболочке, в которой они запущены. Они не вызывают вызов fork(), поэтому они не порождают подоболочку. Ваш третий пример явно запускает подоболочку, вызывая вызов вызова fork(), и таким образом бесконечно рекурсирует. Я считаю, что это должно (по крайней мере частично) ответить на ваш первый вопрос.

В командах 1 и 2 ничего не «создается», поэтому нечего и называть — эти команды выполняются в контексте исходной оболочки.
Обобщение — это разница между «вызовом» процедуры или программы оболочки и «источником» процедуры или программы оболочки — последний обычно применим только к командам/скриптам оболочки, а не к внешним программам. «Источник» сценария оболочки обычно выполняется через . <scriptname>в отличие от ./<scriptname>или /full/path/to/script— обратите внимание на последовательность «точка-пробел» в начале директивы источника. Источник также может быть вызван с помощью source <scriptname>, при этом sourceкоманда является внутренней для оболочки.

Answer

Когда в руководстве говорится, что команды в .zshenv"sourced", это означает, что они выполняются в оболочке, в которой они запущены. Они не вызывают вызов fork(), поэтому они не порождают подоболочку. Ваш третий пример явно запускает подоболочку, вызывая вызов вызова fork(), и таким образом бесконечно рекурсирует. Я считаю, что это должно (по крайней мере частично) ответить на ваш первый вопрос.

В командах 1 и 2 ничего не «создается», поэтому нечего и называть — эти команды выполняются в контексте исходной оболочки.
Обобщение — это разница между «вызовом» процедуры или программы оболочки и «источником» процедуры или программы оболочки — последний обычно применим только к командам/скриптам оболочки, а не к внешним программам. «Источник» сценария оболочки обычно выполняется через . <scriptname>в отличие от ./<scriptname>или /full/path/to/script— обратите внимание на последовательность «точка-пробел» в начале директивы источника. Источник также может быть вызван с помощью source <scriptname>, при этом sourceкоманда является внутренней для оболочки.

Question 3

fork, предполагая, что все идет хорошо, возвращает дважды. Один возврат происходит в родительском процессе (который имеет исходный идентификатор процесса), а другой — в новом дочернем процессе (другой идентификатор процесса, но в остальном имеющий много общего с родительским процессом). В этот момент дочерний процесс может exec(3)что-то сделать, что приведет к загрузке в этот процесс «нового» двоичного файла, хотя дочернему процессу это делать не нужно, и он может запустить другой код, уже загруженный через родительский процесс (например, функции zsh). Следовательно, a forkможет привести или не привести к «совершенно новому» процессу, если «совершенно новый» подразумевает что-то, загруженное через exec(3)системный вызов.

Угадать, какие команды вызывают бесконечную регрессию заранее, сложно; помимо случая «форк-вызов-форка» (также известного как «форкбомба»), есть еще один простой способ — использовать наивную функцию-обертку вокруг некоторой команды.

function ssh() {
   ssh -o UseRoaming=no "$@"
}

который вместо этого, вероятно, следует записать как

function ssh() {
  =ssh -o UseRoaming=no "$@"
}

или command ssh ...чтобы избежать бесконечных вызовов функции, sshвызывающей sshфункцию, вызывающую ... Это никоим образом не затрагивает fork, поскольку вызовы функций являются внутренними для процесса ZSH, но будут без проблем происходить до бесконечности, пока этот единственный процесс ZSH не упрется в какой-то предел.

strace, как всегда, удобно для точного отображения того, какие системные вызовы задействованы для любой команды (в частности, здесь forkи, возможно, в некоторых execвызовах); оболочки могут быть отлажены с помощью -xили аналогичного, который показывает, что оболочка делает внутри (например, вызовы функций). Для более подробного чтения, Стивенс в "Расширенном программировании в среде Unix" имеет несколько глав, связанных с созданием и обработкой новых процессов.

Answer

fork, предполагая, что все идет хорошо, возвращает дважды. Один возврат происходит в родительском процессе (который имеет исходный идентификатор процесса), а другой — в новом дочернем процессе (другой идентификатор процесса, но в остальном имеющий много общего с родительским процессом). В этот момент дочерний процесс может exec(3)что-то сделать, что приведет к загрузке в этот процесс «нового» двоичного файла, хотя дочернему процессу это делать не нужно, и он может запустить другой код, уже загруженный через родительский процесс (например, функции zsh). Следовательно, a forkможет привести или не привести к «совершенно новому» процессу, если «совершенно новый» подразумевает что-то, загруженное через exec(3)системный вызов.

Угадать, какие команды вызывают бесконечную регрессию заранее, сложно; помимо случая «форк-вызов-форка» (также известного как «форкбомба»), есть еще один простой способ — использовать наивную функцию-обертку вокруг некоторой команды.

function ssh() {
   ssh -o UseRoaming=no "$@"
}

который вместо этого, вероятно, следует записать как

function ssh() {
  =ssh -o UseRoaming=no "$@"
}

или command ssh ...чтобы избежать бесконечных вызовов функции, sshвызывающей sshфункцию, вызывающую ... Это никоим образом не затрагивает fork, поскольку вызовы функций являются внутренними для процесса ZSH, но будут без проблем происходить до бесконечности, пока этот единственный процесс ZSH не упрется в какой-то предел.

strace, как всегда, удобно для точного отображения того, какие системные вызовы задействованы для любой команды (в частности, здесь forkи, возможно, в некоторых execвызовах); оболочки могут быть отлажены с помощью -xили аналогичного, который показывает, что оболочка делает внутри (например, вызовы функций). Для более подробного чтения, Стивенс в "Расширенном программировании в среде Unix" имеет несколько глав, связанных с созданием и обработкой новых процессов.

О `fork`, дочерних процессах и "подоболочках"

решение1

решение2

решение3

Связанный контент