Relative Position der Bits in der „Bit-Sequenz“ einer Datei

Relative Position der Bits in der „Bit-Sequenz“ einer Datei

Jede Datei wird als Bits & Bits & Bits & … usw. geschrieben.

Außerdem hat jede Datei zwei Arten von Metadaten:

  1. Betriebssystem-Metadaten: Dateispeicherort, Eigentümer, Berechtigungen usw., die im Betriebssystem selbst geschrieben sind (z. B. im Inode für Linux)
  2. Nicht-Betriebssystem-Metadaten: Copyright-Informationen, Farbtiefe, Bildauflösung, Verschlussgeschwindigkeit usw., die in die Datei selbst geschrieben werden.

Meine Frage ist, was die relativen Positionen der eigentlichen Dateidaten und der in die Datei geschriebenen Metadaten in der „Bitfolge“ der gesamten Datei sind. Kommen in der „Bitfolge“ zuerst die Metadaten oder der eigentliche Dateiinhalt?

BERATEN WERDEN:Wenn die Antwort stark vom Dateityp abhängt, bevorzugen Sie bitte den Dateityp .mp3.

Antwort1

Jede Datei wird als Bits & Bits & Bits & … usw. geschrieben.

In den meisten Betriebssystemen sind DateienByteSequenzen auf Betriebssystemebene – d. h. sie sind nur als 8-Bit-Einheiten und nicht als einzelne Bits adressierbar.

Für einige Dateiformate kann die Neuinterpretation der Bytes als Bitstrom (oder häufiger als Sammlung von Bitstrom-„Paketen“) spezifiziert sein, aber das ist nicht der allgemeine Fall.

Kommen zuerst die Metadaten oder der eigentliche Dateiinhalt, in der „Bitfolge“?

Essehr vielhängt vom Dateityp ab: das ist buchstäblich ein großer Teil dessen, was der Dateitypdefiniert.

Bei einigen Dateiformaten ist angegeben, dass die Metadaten am Anfang stehen, bei anderen am Ende, und wieder andere verwenden ein strukturiertes Format (z. B. RIFF- oder PNG-Blöcke), bei dem der Metadatenblock überall platziert werden kann, solange er mit einer bestimmten Kennung versehen ist.

  • MP3-Dateien verwenden das ID3v2-Tag-Format – die Position und das Layout des Metadatenblocks sind im ID3 definiertVersion 2.3.0oderVersion 2.4.0Spezifikation. (Zum Beispiel heißt es in Abschnitt 5 des letzten Links, dass das Tagsollenam Anfang sein.)

    Viele MP3-Dateien enthalten jedoch auch einen ID3v1-Tagblock am Ende der Datei (die letzten 256 Bytes), und einige haben möglicherweise sogar nur ID3v1, aber nicht ID3v2. Tatsächlich war das MP3-Dateiformat ursprünglichnichtgibt es überhaupt keine Vorkehrungen für eingebettete Metadaten und ich glaube, die ID3v2-Tags sind immer noch so strukturiert, dass sie (aus Kompatibilitätsgründen) so tun, als wären sie nicht abspielbare Audio-Frames.

  • PNG-Dateien verwenden einemarkierter BlockStruktur, in der sich die kritischen Metadaten befinden'IDAT' und andereBlöcke mit bestimmten Tags – unabhängig von ihrem Offset innerhalb der Datei. (Die einzige Einschränkung besteht darin, dass sie den eigentlichen „Daten“-Blöcken vorangehen müssen.)

    JPEG-Dateien verwenden ebenfalls getaggte Segmente und enthalten Metadaten imExifFormat, das heißt ... eine ganze TIFF-Datei, eingebettet in ein JPEG-Segment. Sie müssen also drei Formatebenen interpretieren – zuerst JPEG, dann TIFF und schließlich Exif.Siehe auch.Auch hier kann der Speicherort des Segments variieren. Durch das Typ-Tag wird festgestellt, dass das Segment Metadaten enthält.

  • PE/COFF-Dateien (Windows .exe) sind eine Mischung: Sie haben einen festen Offset am Anfang, aber sie enthalten nur eineZeigerzum echten PE-Header, so dass dietatsächliche HeaderDer Offset kann von Datei zu Datei unterschiedlich sein. Dieser Header hat einige Metadaten an festen Offsets, dann hat er einenAbschnittListe, die weitere Metadaten an beliebigen Stellen enthalten kann, solange sie einen bestimmten Abschnittsnamen hat.

  • Bei Microsoft Office- (.docx/.xlsx) und OpenDocument-Dateien (.odt/.ods) handelt es sich eigentlich um Zip-Archive. Sie verfügen also am Ende über Metadaten auf Zip-Ebene (das „Verzeichnis“) und die eigentlichen Dokumentmetadaten sind in einer bestimmten „Datei“ in diesem Zip-Archiv gespeichert. Sie müssen daher das Zip-Dateiverzeichnis interpretieren, um die Office-Metadaten zu finden.

  • Einige Dateitypen haben keine eingebetteten Metadaten. Textdateien (.txt) enthalten beispielsweise nur beliebigen Text.

verwandte Informationen