Я использую Ubuntu 14.04. У меня есть выписка в формате PDF, и я хочу преобразовать ее в формат файла Excel. Есть ли какой-либо OCR-движок/программное обеспечение, которое может выполнить эту задачу? Может кто-нибудь посоветовать.
решение1
Одним из возможных решений является открытие PDF-файла с помощью PDFedit, а затем сохранение файла как текстового файла.
Если вы хотите установить PDFedit, просто введите в терминале следующее.
$ sudo apt-get update
$ sudo apt-get install pdfedit
Затем вы можете импортировать текстовый файл в OpenOffice.org (или LibreOffice), Calc и т. д. и сохранить полученную электронную таблицу в желаемом формате (например, ods, xls и т. д.).
Чтобы импортировать текстовый файл в Calc, откройте диалоговое окно Text Import через меню Insert, Sheet from File. Затем выберите либо опцию "Fixed width", либо "Separated by" в зависимости от ваших данных. Обратите внимание, что если вы используете опцию "Fixed width", вы можете задать ширину каждого столбца через предварительный просмотр "Fields" в поле.