У меня есть PDF-файл, представляющий собой отсканированную форму, содержащую изображения, таблицы и текст.
Я хотел бы запустить программу (не онлайн-инструмент) на файле и сделать так, чтобы она создала txt-файл, содержащий слова. Не слишком заморачиваюсь с форматированием.
Обратите внимание, что это не повтор фразы «Преобразовать PDF в текст, игнорируя структуру», поскольку она относится к тексту в обычных PDF-документах, а не к отсканированным изображениям, сохраненным в формате PDF.