Warum ist ein dateisystemintensives Skript auf einer RAM-Disk nicht schneller?

Question 1

Ganz allgemein gesagt werden alle Vorgänge zunächst im RAM ausgeführt – Dateisysteme werden zwischengespeichert. Es gibt Ausnahmen von dieser Regel, aber diese eher speziellen Fälle ergeben sich normalerweise aus ganz bestimmten Anforderungen. Daher werden Sie den Unterschied erst bemerken, wenn Sie mit dem Leeren des Caches beginnen.

Eine andere Sache ist, dass die Leistung davon abhängteine Mengevom genauen Dateisystem ab - einige zielen auf einen einfacheren Zugriff auf große Mengen kleiner Dateien ab, andere sind effizient bei der Echtzeit-Datenübertragung von und zu großen Dateien (Multimedia-Erfassung/-Streaming), einige legen Wert auf Datenkohärenz und andere können so konzipiert werden, dass sie einen geringen Speicher-/Codebedarf haben.

Zurück zu Ihrem Anwendungsfall: In nur einem Schleifendurchlauf erzeugen Sie etwa 20 neue Prozesse, von denen die meisten nur ein Verzeichnis/eine Datei erstellen (beachten Sie, dass ()eine Sub-Shell erstellt und für jede einzelne Übereinstimmung finderzeugt wird cat) - der Engpass ist in der Tat nicht das Dateisystem (und wenn Ihr SystemASLRund Sie haben keine gute, schnelle Entropiequelle, dann wird der Zufallspool Ihres Systems auch ziemlich schnell erschöpft). Dasselbe gilt für FUSE, das in Perl geschrieben ist – es ist nicht das richtige Werkzeug für diese Aufgabe.

Answer

Ganz allgemein gesagt werden alle Vorgänge zunächst im RAM ausgeführt – Dateisysteme werden zwischengespeichert. Es gibt Ausnahmen von dieser Regel, aber diese eher speziellen Fälle ergeben sich normalerweise aus ganz bestimmten Anforderungen. Daher werden Sie den Unterschied erst bemerken, wenn Sie mit dem Leeren des Caches beginnen.

Eine andere Sache ist, dass die Leistung davon abhängteine Mengevom genauen Dateisystem ab - einige zielen auf einen einfacheren Zugriff auf große Mengen kleiner Dateien ab, andere sind effizient bei der Echtzeit-Datenübertragung von und zu großen Dateien (Multimedia-Erfassung/-Streaming), einige legen Wert auf Datenkohärenz und andere können so konzipiert werden, dass sie einen geringen Speicher-/Codebedarf haben.

Zurück zu Ihrem Anwendungsfall: In nur einem Schleifendurchlauf erzeugen Sie etwa 20 neue Prozesse, von denen die meisten nur ein Verzeichnis/eine Datei erstellen (beachten Sie, dass ()eine Sub-Shell erstellt und für jede einzelne Übereinstimmung finderzeugt wird cat) - der Engpass ist in der Tat nicht das Dateisystem (und wenn Ihr SystemASLRund Sie haben keine gute, schnelle Entropiequelle, dann wird der Zufallspool Ihres Systems auch ziemlich schnell erschöpft). Dasselbe gilt für FUSE, das in Perl geschrieben ist – es ist nicht das richtige Werkzeug für diese Aufgabe.

Question 2

Eine etwas längere Antwort als mein Kommentar, dass die Tests hauptsächlich aus kleinen Transaktionen bestehen.

Arbeitsbelastung reicht nicht zum Testen aus

Wenn Sie Ihr Dateisystem einem Stresstest unterziehen möchten, benötigen Sie größere Arbeitspakete.

Je nachdem, wie viel Speicher Sie auf Ihrem Rechner haben, werden Sie selbst bei Zehntausenden von Ordnererstellungsvorgängen keinen merklichen Unterschied zwischen den beiden feststellen. Passen Sie daher Ihre Arbeitslast an, um die Dateisysteme ausreichend zu testen, und berücksichtigen Sie dabei Ihren Speicher, der als Puffer verwendet wird.

Es gibt zahlreiche Möglichkeiten, einen Test zu konzipieren, der die Vorteile Ihres System-RAMs und andere Faktoren zunichte macht, die Ihre Testergebnisse verfälschen.

Oder Sie können eine standardisierte Testsuite verwenden, wie bonnie++

Answer