Richtige Methode zum Konvertieren von PDF in Word über die Bash-Befehlszeile

Richtige Methode zum Konvertieren von PDF in Word über die Bash-Befehlszeile

Ich muss 1K PDF-Dateien auf einem Debian-Server in DOC konvertieren. Ich kann eine PDF-Datei mit der LibreOffice-Befehlszeile in Word konvertieren:

libreoffice --headless --invisible --convert-to doc Sample-doc-file-100kb.pdf

Oder mit soffice:

soffice --nocrashreport --nologo --nolockcheck --nofirststartwizard --invisible --headless --convert-to doc Sample-doc-file-100kb.pdf

Das Hauptproblem bei den beiden obigen Befehlen ist, dass die doc-Datei keine Bilder in die Seiten einschließt, sondern nur den formatierten Text. Gibt es eine bessere Möglichkeit, PDF in doc umzuwandeln und dabei auch die im PDF vorhandenen Bilder einzuschließen? Ich bin nicht an Webdiensten wie zamzam interessiert, ich muss das über die Befehlszeile auf dem Server tun. Danke.

Antwort1

Sie könnten es mit der Software Abiword versuchen. Beispiel:

abiword --to=doc beispiel.pdf

Antwort2

Mir ist es gelungen, indem ich Folgendes verwendet habe:

libreoffice --infilter=="writer_pdf_import" --headless \
--convert-to doc:"writer_pdf_Export" Brief.pdf  

Es gibt mir die gleiche Ausgabe wie die Antwort von @igiannak.

Antwort3

Jeder direkte Befehl der Befehlszeilenschnittstelle ist für die Konvertierung von PDF in DOCX verfügbar, einschließlich der im PDF vorhandenen Bilder. Ich habe die Befehle von LibreOffice und SOffice ausprobiert, aber es wurde nur einfacher formatierter Text ausgegeben, wie bei jeder anderen pywin32.com-Clientbibliothek, die unter Linux/Ubuntu für die Konvertierung von PDF in Word verfügbar ist.

Betriebssystem importieren System importieren

comtypes.client importieren

wdFormatPDF = 17

def covx_to_pdf(infile, outfile): """Konvertiert eine Word-DOCX-Datei in PDF"""

word = comtypes.client.CreateObject('Word.Application')
doc = word.Documents.Open(infile)
doc.SaveAs(outfile, FileFormat=wdFormatPDF)
doc.Close()
word.Quit()

Dieser Code funktioniert auf Windows-Rechnern für die Konvertierung von PDF in Word, aber dieses Paket unterstützt keine Linux-/Debian-Plattformen. Können wir einen Vorschlag für die gleiche Implementierung auf Linux/Debian für die Konvertierung von PDF in Word haben?

verwandte Informationen