Zu `fork`, untergeordneten Prozessen und "Subshells"

Question 1

Da laut zshall(1) $ZDOTDIR/.zshenv immer dann als Quelle verwendet wird, wenn eine neue Instanz von zsh gestartet wird

Wenn Sie sich hier auf das Wort „beginnt“ konzentrieren, werden Sie die Dinge besser verstehen. Der Effekt fork()ist, einen weiteren Prozess zu schaffendas genau dort ansetzt, wo der aktuelle Prozess bereits beginnt. Es klont einen bestehenden Prozess, wobei der einzige Unterschied der Rückgabewert von ist fork. Die Dokumentation verwendet „startet“, um zu bedeuten, dass das Programm von Anfang an aufgerufen wird.

Ihr Beispiel Nr. 3 führt aus $SHELL -c 'date; printenv; echo $$'und startet einen völlig neuen Prozess von Anfang an. Er durchläuft das normale Startverhalten. Sie können dies beispielsweise veranschaulichen, indem Sie in einer anderen Shell Folgendes austauschen: run bash -c ' ... 'statt zsh -c ' ... '. Die Verwendung von ist $SHELLhier nichts Besonderes.

Beispiele Nr. 1 und Nr. 2 führen Subshells aus. Die Shell forkführt Ihre Befehle in diesem untergeordneten Prozess aus und fährt dann mit ihrer eigenen Ausführung fort, wenn der untergeordnete Prozess fertig ist.

Die Antwort auf Ihre Frage Nr. 1 lautet wie folgt: Beispiel 3 führt von Anfang an eine völlig neue Shell aus, während die anderen beiden Subshells ausführen. Das Startverhalten umfasst das Laden .zshenv.

Der Grund, warum dieses Verhalten ausdrücklich erwähnt wird und der wahrscheinlich auch zu Ihrer Verwirrung führt, besteht darin, dass diese Datei (im Gegensatz zu einigen anderen) sowohl in interaktiven als auch in nicht-interaktiven Shells geladen wird.

Zu Ihrer Frage Nr. 2:

Wenn die in Nr. 1 und Nr. 2 erstellten Shells „Subshells“ genannt werden, wie heißen dann die, die beispielsweise in Nr. 3 generiert werden?

Wenn Sie einen Namen möchten, können Sie es „untergeordnete Shell“ nennen, aber eigentlich ist es nichts. Es ist nicht anders als jeder andere Prozess, den Sie von der Shell aus starten, sei es dieselbe Shell, eine andere Shell oder cat…

Zu Ihrer Frage Nr. 3:

ist es möglich, die oben beschriebenen empirischen/anekdotischen Ergebnisse im Hinblick auf die „Theorie“ (in Ermangelung eines besseren Wortes) der Unix-Prozesse zu rationalisieren (und möglicherweise zu verallgemeinern)?

forkerstellt einen neuen Prozess mit einer neuen PID, der parallel genau dort ausgeführt wird, wo der vorherige aufgehört hat.execersetzt den aktuell ausgeführten Code durch ein neues Programm, das von irgendwoher geladen wurde und von Anfang an ausgeführt wird. Wenn Sie ein neues Programm erzeugen, sind Sie zuerst forkSie selbst und dann execdieses Programm im Kind. Das ist die grundlegende Theorie der Prozesse, die überall gilt, innerhalb und außerhalb von Shells.

Subshells sind forks, und jeder nicht integrierte Befehl, den Sie ausführen, führt sowohl zu einem forkals auch zu einem exec.

Beachten Sie, dass sich dies $$auf die PID der übergeordneten Shell ausdehntin jeder POSIX-kompatiblen Shell, daher erhalten Sie möglicherweise trotzdem nicht die erwartete Ausgabe. Beachten Sie auch, dass zsh die Ausführung der Subshell ohnehin aggressiv optimiert und normalerweise execden letzten Befehl ausführt oder die Subshell überhaupt nicht startet, wenn alle Befehle ohne sie sicher sind.

Ein nützlicher Befehl zum Testen Ihrer Intuitionen ist:

strace -e trace=process -f $SHELL -c ' ... '

Dadurch werden alle prozessbezogenen Ereignisse (und keine anderen) für den Befehl, den ...Sie in einer neuen Shell ausführen, in die Standardfehlerausgabe gedruckt. Sie können sehen, was in einem neuen Prozess ausgeführt wird und was nicht, und wo execs auftreten.

Ein weiterer möglicherweise nützlicher Befehl ist pstree -h, der den Baum der übergeordneten Prozesse des aktuellen Prozesses ausgibt und hervorhebt. Sie können sehen, wie viele Ebenen tief Sie sich in der Ausgabe befinden.

Answer

Da laut zshall(1) $ZDOTDIR/.zshenv immer dann als Quelle verwendet wird, wenn eine neue Instanz von zsh gestartet wird

Wenn Sie sich hier auf das Wort „beginnt“ konzentrieren, werden Sie die Dinge besser verstehen. Der Effekt fork()ist, einen weiteren Prozess zu schaffendas genau dort ansetzt, wo der aktuelle Prozess bereits beginnt. Es klont einen bestehenden Prozess, wobei der einzige Unterschied der Rückgabewert von ist fork. Die Dokumentation verwendet „startet“, um zu bedeuten, dass das Programm von Anfang an aufgerufen wird.

Ihr Beispiel Nr. 3 führt aus $SHELL -c 'date; printenv; echo $$'und startet einen völlig neuen Prozess von Anfang an. Er durchläuft das normale Startverhalten. Sie können dies beispielsweise veranschaulichen, indem Sie in einer anderen Shell Folgendes austauschen: run bash -c ' ... 'statt zsh -c ' ... '. Die Verwendung von ist $SHELLhier nichts Besonderes.

Beispiele Nr. 1 und Nr. 2 führen Subshells aus. Die Shell forkführt Ihre Befehle in diesem untergeordneten Prozess aus und fährt dann mit ihrer eigenen Ausführung fort, wenn der untergeordnete Prozess fertig ist.

Die Antwort auf Ihre Frage Nr. 1 lautet wie folgt: Beispiel 3 führt von Anfang an eine völlig neue Shell aus, während die anderen beiden Subshells ausführen. Das Startverhalten umfasst das Laden .zshenv.

Der Grund, warum dieses Verhalten ausdrücklich erwähnt wird und der wahrscheinlich auch zu Ihrer Verwirrung führt, besteht darin, dass diese Datei (im Gegensatz zu einigen anderen) sowohl in interaktiven als auch in nicht-interaktiven Shells geladen wird.

Zu Ihrer Frage Nr. 2:

Wenn die in Nr. 1 und Nr. 2 erstellten Shells „Subshells“ genannt werden, wie heißen dann die, die beispielsweise in Nr. 3 generiert werden?

Wenn Sie einen Namen möchten, können Sie es „untergeordnete Shell“ nennen, aber eigentlich ist es nichts. Es ist nicht anders als jeder andere Prozess, den Sie von der Shell aus starten, sei es dieselbe Shell, eine andere Shell oder cat…

Zu Ihrer Frage Nr. 3:

ist es möglich, die oben beschriebenen empirischen/anekdotischen Ergebnisse im Hinblick auf die „Theorie“ (in Ermangelung eines besseren Wortes) der Unix-Prozesse zu rationalisieren (und möglicherweise zu verallgemeinern)?

forkerstellt einen neuen Prozess mit einer neuen PID, der parallel genau dort ausgeführt wird, wo der vorherige aufgehört hat.execersetzt den aktuell ausgeführten Code durch ein neues Programm, das von irgendwoher geladen wurde und von Anfang an ausgeführt wird. Wenn Sie ein neues Programm erzeugen, sind Sie zuerst forkSie selbst und dann execdieses Programm im Kind. Das ist die grundlegende Theorie der Prozesse, die überall gilt, innerhalb und außerhalb von Shells.

Subshells sind forks, und jeder nicht integrierte Befehl, den Sie ausführen, führt sowohl zu einem forkals auch zu einem exec.

Beachten Sie, dass sich dies $$auf die PID der übergeordneten Shell ausdehntin jeder POSIX-kompatiblen Shell, daher erhalten Sie möglicherweise trotzdem nicht die erwartete Ausgabe. Beachten Sie auch, dass zsh die Ausführung der Subshell ohnehin aggressiv optimiert und normalerweise execden letzten Befehl ausführt oder die Subshell überhaupt nicht startet, wenn alle Befehle ohne sie sicher sind.

Ein nützlicher Befehl zum Testen Ihrer Intuitionen ist:

strace -e trace=process -f $SHELL -c ' ... '

Dadurch werden alle prozessbezogenen Ereignisse (und keine anderen) für den Befehl, den ...Sie in einer neuen Shell ausführen, in die Standardfehlerausgabe gedruckt. Sie können sehen, was in einem neuen Prozess ausgeführt wird und was nicht, und wo execs auftreten.

Ein weiterer möglicherweise nützlicher Befehl ist pstree -h, der den Baum der übergeordneten Prozesse des aktuellen Prozesses ausgibt und hervorhebt. Sie können sehen, wie viele Ebenen tief Sie sich in der Ausgabe befinden.

Question 2

Wenn im Handbuch steht, dass die Befehle in .zshenv"sourced" sind, bedeutet das, dass sie innerhalb der Shell ausgeführt werden, die sie ausführt. Sie verursachen keinen Aufruf von und fork()erzeugen daher keine Subshell. Ihr drittes Beispiel führt explizit eine Subshell aus, die einen Aufruf von auslöst fork()und somit unendlich rekursiv ist. Das sollte, glaube ich, Ihre erste Frage (zumindest teilweise) beantworten.

In den Befehlen 1 und 2 wird nichts „erstellt“, sodass auch nichts aufgerufen werden kann – diese Befehle werden im Kontext der Sourcing-Shell ausgeführt.
Die Verallgemeinerung ist der Unterschied zwischen dem „Aufrufen“ einer Shell-Routine oder eines Shell-Programms und dem „Sourcing“ einer Shell-Routine oder eines Shell-Programms – wobei letzteres normalerweise nur auf Shell-Befehle/-Skripte anwendbar ist, nicht auf externe Programme. Das „Sourcing“ eines Shell-Skripts erfolgt normalerweise über . <scriptname>im Gegensatz zu ./<scriptname>oder /full/path/to/script– beachten Sie die „Punkt-Leerzeichen“-Sequenz am Anfang der Sourcing-Direktive. Sourcing kann auch mit aufgerufen werden source <scriptname>, wobei der sourceBefehl ein interner Shell-Befehl ist.

Answer

Wenn im Handbuch steht, dass die Befehle in .zshenv"sourced" sind, bedeutet das, dass sie innerhalb der Shell ausgeführt werden, die sie ausführt. Sie verursachen keinen Aufruf von und fork()erzeugen daher keine Subshell. Ihr drittes Beispiel führt explizit eine Subshell aus, die einen Aufruf von auslöst fork()und somit unendlich rekursiv ist. Das sollte, glaube ich, Ihre erste Frage (zumindest teilweise) beantworten.

In den Befehlen 1 und 2 wird nichts „erstellt“, sodass auch nichts aufgerufen werden kann – diese Befehle werden im Kontext der Sourcing-Shell ausgeführt.
Die Verallgemeinerung ist der Unterschied zwischen dem „Aufrufen“ einer Shell-Routine oder eines Shell-Programms und dem „Sourcing“ einer Shell-Routine oder eines Shell-Programms – wobei letzteres normalerweise nur auf Shell-Befehle/-Skripte anwendbar ist, nicht auf externe Programme. Das „Sourcing“ eines Shell-Skripts erfolgt normalerweise über . <scriptname>im Gegensatz zu ./<scriptname>oder /full/path/to/script– beachten Sie die „Punkt-Leerzeichen“-Sequenz am Anfang der Sourcing-Direktive. Sourcing kann auch mit aufgerufen werden source <scriptname>, wobei der sourceBefehl ein interner Shell-Befehl ist.

Question 3

fork, vorausgesetzt, alles läuft gut, kehrt zweimal zurück. Eine Rückgabe erfolgt im übergeordneten Prozess (der die ursprüngliche Prozess-ID hat) und die andere im neuen untergeordneten Prozess (eine andere Prozess-ID, die aber ansonsten viel mit dem übergeordneten Prozess gemeinsam hat). An diesem Punkt könnte der untergeordnete Prozess exec(3)etwas ausführen, was dazu führen würde, dass eine „neue“ Binärdatei in diesen Prozess geladen wird, obwohl der untergeordnete Prozess dies nicht tun muss und anderen Code ausführen könnte, der bereits über den übergeordneten Prozess geladen wurde (z. B. zsh-Funktionen). Daher forkkann ein Prozess zu einem „völlig neuen“ Prozess führen oder auch nicht, wenn „völlig neu“ so verstanden wird, dass etwas über einen exec(3)Systemaufruf geladen wurde.

Es ist schwierig, im Voraus zu erraten, welche Befehle einen unendlichen Regress verursachen. Neben dem Fall, bei dem ein Fork einen Fork aufruft (auch als „Forkbombe“ bekannt), gibt es auch einen einfachen Fall, bei dem ein naiver Funktionswrapper um einen Befehl herum verwendet wird.

function ssh() {
   ssh -o UseRoaming=no "$@"
}

was stattdessen wahrscheinlich geschrieben werden sollte als

function ssh() {
  =ssh -o UseRoaming=no "$@"
}

oder command ssh ...um unendliche Funktionsaufrufe der sshFunktion zu vermeiden, die die sshFunktion aufruft, die ... aufruft. Dies hat in keiner Weise zur Folge fork, da die Funktionsaufrufe intern für den ZSH-Prozess sind, aber munter bis ins Unendliche weiterlaufen, bis dieser einzelne ZSH-Prozess an eine Grenze stößt.

straceist wie immer praktisch, um genau zu zeigen, welche Systemaufrufe für einen Befehl erforderlich sind (insbesondere hier forkund vielleicht für einige execAufrufe); Shells können mit -xoder ähnlichem debuggt werden, das zeigt, was die Shell intern tut (z. B. Funktionsaufrufe). Weitere Informationen finden Sie in Stevens' "Advanced Programming in the Unix Environment", das einige Kapitel zur Erstellung und Handhabung neuer Prozesse enthält.

Answer

fork, vorausgesetzt, alles läuft gut, kehrt zweimal zurück. Eine Rückgabe erfolgt im übergeordneten Prozess (der die ursprüngliche Prozess-ID hat) und die andere im neuen untergeordneten Prozess (eine andere Prozess-ID, die aber ansonsten viel mit dem übergeordneten Prozess gemeinsam hat). An diesem Punkt könnte der untergeordnete Prozess exec(3)etwas ausführen, was dazu führen würde, dass eine „neue“ Binärdatei in diesen Prozess geladen wird, obwohl der untergeordnete Prozess dies nicht tun muss und anderen Code ausführen könnte, der bereits über den übergeordneten Prozess geladen wurde (z. B. zsh-Funktionen). Daher forkkann ein Prozess zu einem „völlig neuen“ Prozess führen oder auch nicht, wenn „völlig neu“ so verstanden wird, dass etwas über einen exec(3)Systemaufruf geladen wurde.

Es ist schwierig, im Voraus zu erraten, welche Befehle einen unendlichen Regress verursachen. Neben dem Fall, bei dem ein Fork einen Fork aufruft (auch als „Forkbombe“ bekannt), gibt es auch einen einfachen Fall, bei dem ein naiver Funktionswrapper um einen Befehl herum verwendet wird.

function ssh() {
   ssh -o UseRoaming=no "$@"
}

was stattdessen wahrscheinlich geschrieben werden sollte als

function ssh() {
  =ssh -o UseRoaming=no "$@"
}

oder command ssh ...um unendliche Funktionsaufrufe der sshFunktion zu vermeiden, die die sshFunktion aufruft, die ... aufruft. Dies hat in keiner Weise zur Folge fork, da die Funktionsaufrufe intern für den ZSH-Prozess sind, aber munter bis ins Unendliche weiterlaufen, bis dieser einzelne ZSH-Prozess an eine Grenze stößt.

straceist wie immer praktisch, um genau zu zeigen, welche Systemaufrufe für einen Befehl erforderlich sind (insbesondere hier forkund vielleicht für einige execAufrufe); Shells können mit -xoder ähnlichem debuggt werden, das zeigt, was die Shell intern tut (z. B. Funktionsaufrufe). Weitere Informationen finden Sie in Stevens' "Advanced Programming in the Unix Environment", das einige Kapitel zur Erstellung und Handhabung neuer Prozesse enthält.

Zu `fork`, untergeordneten Prozessen und "Subshells"

Antwort1

Antwort2

Antwort3

verwandte Informationen