用於偵測包含非 ASCII 內容的 PDF 的 Shell 腳本

用於偵測包含非 ASCII 內容的 PDF 的 Shell 腳本

我需要一個 shell 腳本來偵測有效的 PDF。也就是說,我只需要保留純 ASCII PDF。其他包含非 ASCII 內容和惡意腳本的 PDF 需要刪除。我該怎麼做呢?有沒有可用的腳本來做到這一點?

答案1

您想要的是所謂的病毒掃描程式。例如。蛤蜊病毒

答案2

這裡有一些 python 腳本。 「惡意軟體檔案:PDF 文件」Bruce Schneier 在他的網站上也提到了這一點。

pdf2ps 很簡單,但不太確定。這是有趣的 PDF/Ahttp://en.wikipedia.org/wiki/PDF/A不允許多媒體元素。

相關內容