Я преподаю в колледже, и некоторое время назад мне было весело замечать студентов, которые копировали работы других студентов, просто беря их файл Word и «перефразируя» предложения. Таким образом, студент A невинно одалживал свой файл студенту B, который злонамеренно копировал его работу. Плагиат было легко обнаружить, но я обнаружил, что когда они это делали, «автором» файла Word, представленного студентом B, был указан студент A (студент B был только редактором).
Мои студенты это поняли. На этот раз двое из них прислали pdf-файлы.
Опять же, плагиат легко обнаружить. Однако было бы неплохо иметь такие же веские доказательства, как и раньше.
Можно ли узнать автора файла, из которого был создан PDF-файл?
Я пробовал использоватьExifTool, который дает метаданные для pdf, но это не идет достаточно далеко назад. Поэтому я ожидаю, что ответ на мой вопрос будет "нет". Но было бы неплохо, если бы это подтвердилось для меня :-)
решение1
Не существует точного способа узнать, является ли человек на самом деле автором документа, который он вам отправил, поскольку удаление метаданных из документа Word — тривиальная задача.
Персональную информацию можно легко удалить с помощьюПроверить документфункция Microsoft Word (2007 и более поздние версии)
Однако, если ваши ученики не отредактировали/не удалили его перед конвертацией документа в PDF, вы можете узнать автора, просто открыв документ в Microsoft Reader, Adobe Reader, Foxit Reader и т. д. и просмотрев его метаданные (Файл → Свойства в Adobe Reader).
Однако для проверки на плагиат вы можете попробовать преобразовать документ в HTML или обычный текстовый формат (просто скопируйте и вставьте содержимое в Блокнот и сохраните как .TXT) и загрузить его на веб-сервер, которым вы управляете (публичные файлы в Dropbox также подойдут) и указать URL-адрес документа вКопискейп.
решение2
ПроверитьPDFParserДидье Стивенса или другого инструмента, упомянутого на его сайте, и, возможно, вам повезет больше.
Насколько я понимаю, "автор" либо будет содержаться в метаданных, либо нет. В PDF нет свободного места или чего-то подобного, что можно было бы вырезать, но я думаю, что вымогпопробуйте выполнить поиск по строкам, содержащимся в файле, и поискать упоминания имени, которого нет в самом документе.