Gibt es eine Möglichkeit, Dateien anhand des Hash-Werts zu suchen?

Question 1

Linux-Beispiel:

hash='74e7432df4a66f246b5214d60b190b67e2f6ce52'
find . -type f -exec sh -c '
   sha1sum "$2" | cut -f 1 -d " " | sed "s|^\\\\||" | grep -Eqi "$1"
' find-sh "$hash" {} \; -print

Dieser Code ist aus folgenden Gründen komplexer als Sie denken:

Es ist dafür gedacht, Dateinamen mit Leerzeichen, Zeilenumbrüchen, Backslashes, Anführungszeichen, Sonderzeichen usw. korrekt zu verarbeiten. (Ändern Sie es -printin , -print0um sie weiter zu analysieren.)
es ist beabsichtigt, Hashes als reguläre Ausdrücke zu akzeptieren (kompatibel mit grep -E) egrep,
d. h. es '^00|00$'wird eine Übereinstimmung gefunden, wenn der Datei-Hash mit beginnt oder endet 00; ein praktischeres Beispiel ist die Suche nach vielen Hashes gleichzeitig: '74…|a9…|…|…|…'(Auslassungspunkte der Kürze halber, verwenden Sie vollständige Hashes).

*sumSie können andere Tools mit kompatibler Schnittstelle verwenden (z. B. md5sum).

Answer

Linux-Beispiel:

hash='74e7432df4a66f246b5214d60b190b67e2f6ce52'
find . -type f -exec sh -c '
   sha1sum "$2" | cut -f 1 -d " " | sed "s|^\\\\||" | grep -Eqi "$1"
' find-sh "$hash" {} \; -print

Dieser Code ist aus folgenden Gründen komplexer als Sie denken:

Es ist dafür gedacht, Dateinamen mit Leerzeichen, Zeilenumbrüchen, Backslashes, Anführungszeichen, Sonderzeichen usw. korrekt zu verarbeiten. (Ändern Sie es -printin , -print0um sie weiter zu analysieren.)
es ist beabsichtigt, Hashes als reguläre Ausdrücke zu akzeptieren (kompatibel mit grep -E) egrep,
d. h. es '^00|00$'wird eine Übereinstimmung gefunden, wenn der Datei-Hash mit beginnt oder endet 00; ein praktischeres Beispiel ist die Suche nach vielen Hashes gleichzeitig: '74…|a9…|…|…|…'(Auslassungspunkte der Kürze halber, verwenden Sie vollständige Hashes).

*sumSie können andere Tools mit kompatibler Schnittstelle verwenden (z. B. md5sum).

Question 2

Wenn Sie PowerShell v.4.0 oder höher haben, können Sie den folgenden Befehl verwenden:

Get-ChildItem _search_location_ -Recurse | Get-FileHash | 
Where-Object hash -eq (Get-FileHash _search_file_).hash | Select path

Dabei _search_location_ist der Ordner oder Datenträger, in dem Sie nach Duplikaten suchen möchten, und _search_file_eine Datei, die irgendwo ein Duplikat enthält. Sie können diesen Befehl in eine Schleife einfügen, um nach mehreren Dateien zu suchen, oder | Remove-Itemam Ende der Zeile hinzufügen, um Duplikate automatisch zu löschen.

Beachten Sie auch, dass dieser Befehl nur für kleine Suchordner geeignet ist. Er nimmt viel Zeit in Anspruch, wenn Ihr Suchort Tausende von Dateien enthält (z. B. eine ganze Festplatte).

Answer

Wenn Sie PowerShell v.4.0 oder höher haben, können Sie den folgenden Befehl verwenden:

Get-ChildItem _search_location_ -Recurse | Get-FileHash | 
Where-Object hash -eq (Get-FileHash _search_file_).hash | Select path

Dabei _search_location_ist der Ordner oder Datenträger, in dem Sie nach Duplikaten suchen möchten, und _search_file_eine Datei, die irgendwo ein Duplikat enthält. Sie können diesen Befehl in eine Schleife einfügen, um nach mehreren Dateien zu suchen, oder | Remove-Itemam Ende der Zeile hinzufügen, um Duplikate automatisch zu löschen.

Beachten Sie auch, dass dieser Befehl nur für kleine Suchordner geeignet ist. Er nimmt viel Zeit in Anspruch, wenn Ihr Suchort Tausende von Dateien enthält (z. B. eine ganze Festplatte).

Question 3

Das ist eine spannende Frage. Ich habe ein Tool namens fdupes verwendet, um etwas Ähnliches zu erreichen. Fdupes durchsucht rekursiv Verzeichnisse und vergleicht jede Datei mit jeder anderen Datei. Zuerst vergleicht es die Größe, und wenn die Größen identisch sind, erstellt es Hashes der Dateien und vergleicht diese. Wenn die Hashes gleich sind, geht es tatsächlich jede Datei Byte für Byte durch und vergleicht sie.

Wenn es alle Dateien findet, die wirklich identisch sind, können Sie es verschiedene Dinge tun lassen. Ich lasse es das Duplikat löschen und an seiner Stelle einen Hardlink erstellen (und spare so Festplattenspeicher), aber Sie können es auch einfach die Speicherorte der Duplikatdateien ausgeben lassen und nichts damit machen. Dies ist das Szenario, nach dem Sie fragen.

Einige Nachteile von fdupes sind, dass es meines Wissens nur unter Linux läuft und dass es, da es jede Datei mit jeder anderen Datei vergleicht, ziemlich viel I/O und Zeit zum Ausführen benötigt. Es „sucht“ nicht direkt nach einer Datei, aber es listet alle Dateien auf, die einen identischen Hash haben.

Ich kann es nur wärmstens empfehlen und habe es so eingerichtet, dass es jeden Tag in einem Cron-Job ausgeführt wird, damit ich nie unnötige Duplikate meiner Daten habe (meine Backups sind hiervon natürlich ausgenommen).

Fdupes-Quellseite

Answer

Das ist eine spannende Frage. Ich habe ein Tool namens fdupes verwendet, um etwas Ähnliches zu erreichen. Fdupes durchsucht rekursiv Verzeichnisse und vergleicht jede Datei mit jeder anderen Datei. Zuerst vergleicht es die Größe, und wenn die Größen identisch sind, erstellt es Hashes der Dateien und vergleicht diese. Wenn die Hashes gleich sind, geht es tatsächlich jede Datei Byte für Byte durch und vergleicht sie.

Wenn es alle Dateien findet, die wirklich identisch sind, können Sie es verschiedene Dinge tun lassen. Ich lasse es das Duplikat löschen und an seiner Stelle einen Hardlink erstellen (und spare so Festplattenspeicher), aber Sie können es auch einfach die Speicherorte der Duplikatdateien ausgeben lassen und nichts damit machen. Dies ist das Szenario, nach dem Sie fragen.

Einige Nachteile von fdupes sind, dass es meines Wissens nur unter Linux läuft und dass es, da es jede Datei mit jeder anderen Datei vergleicht, ziemlich viel I/O und Zeit zum Ausführen benötigt. Es „sucht“ nicht direkt nach einer Datei, aber es listet alle Dateien auf, die einen identischen Hash haben.

Ich kann es nur wärmstens empfehlen und habe es so eingerichtet, dass es jeden Tag in einem Cron-Job ausgeführt wird, damit ich nie unnötige Duplikate meiner Daten habe (meine Backups sind hiervon natürlich ausgenommen).

Fdupes-Quellseite

Question 4

Voidtools Alles 1.5 (Alpha)Das Suchtool für Windows verfügt über eine Option zum Hinzufügen einer Spalte mit verschiedenen Hashes, wie etwa CRC-32, CRC-64, MD5, SHA-1, SHA-256 für jede Datei.

Sie können dann auch nach einem bestimmten Hash suchen, zum Beispielmd5:71E..

Answer

Voidtools Alles 1.5 (Alpha)Das Suchtool für Windows verfügt über eine Option zum Hinzufügen einer Spalte mit verschiedenen Hashes, wie etwa CRC-32, CRC-64, MD5, SHA-1, SHA-256 für jede Datei.

Sie können dann auch nach einem bestimmten Hash suchen, zum Beispielmd5:71E..

Gibt es eine Möglichkeit, Dateien anhand des Hash-Werts zu suchen?

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen