Автор документа, на основе которого был создан PDF-файл?

Автор документа, на основе которого был создан PDF-файл?

Я преподаю в колледже, и некоторое время назад мне было весело замечать студентов, которые копировали работы других студентов, просто беря их файл Word и «перефразируя» предложения. Таким образом, студент A невинно одалживал свой файл студенту B, который злонамеренно копировал его работу. Плагиат было легко обнаружить, но я обнаружил, что когда они это делали, «автором» файла Word, представленного студентом B, был указан студент A (студент B был только редактором).

Мои студенты это поняли. На этот раз двое из них прислали pdf-файлы.

Опять же, плагиат легко обнаружить. Однако было бы неплохо иметь такие же веские доказательства, как и раньше.

Можно ли узнать автора файла, из которого был создан PDF-файл?

Я пробовал использоватьExifTool, который дает метаданные для pdf, но это не идет достаточно далеко назад. Поэтому я ожидаю, что ответ на мой вопрос будет "нет". Но было бы неплохо, если бы это подтвердилось для меня :-)

решение1

Не существует точного способа узнать, является ли человек на самом деле автором документа, который он вам отправил, поскольку удаление метаданных из документа Word — тривиальная задача.

Персональную информацию можно легко удалить с помощьюПроверить документфункция Microsoft Word (2007 и более поздние версии)

Однако, если ваши ученики не отредактировали/не удалили его перед конвертацией документа в PDF, вы можете узнать автора, просто открыв документ в Microsoft Reader, Adobe Reader, Foxit Reader и т. д. и просмотрев его метаданные (Файл → Свойства в Adobe Reader).

Однако для проверки на плагиат вы можете попробовать преобразовать документ в HTML или обычный текстовый формат (просто скопируйте и вставьте содержимое в Блокнот и сохраните как .TXT) и загрузить его на веб-сервер, которым вы управляете (публичные файлы в Dropbox также подойдут) и указать URL-адрес документа вКопискейп.

решение2

ПроверитьPDFParserДидье Стивенса или другого инструмента, упомянутого на его сайте, и, возможно, вам повезет больше.

Насколько я понимаю, "автор" либо будет содержаться в метаданных, либо нет. В PDF нет свободного места или чего-то подобного, что можно было бы вырезать, но я думаю, что вымогпопробуйте выполнить поиск по строкам, содержащимся в файле, и поискать упоминания имени, которого нет в самом документе.

Связанный контент