Ich muss 1K PDF-Dateien auf einem Debian-Server in DOC konvertieren. Ich kann eine PDF-Datei mit der LibreOffice-Befehlszeile in Word konvertieren:
libreoffice --headless --invisible --convert-to doc Sample-doc-file-100kb.pdf
Oder mit soffice:
soffice --nocrashreport --nologo --nolockcheck --nofirststartwizard --invisible --headless --convert-to doc Sample-doc-file-100kb.pdf
Das Hauptproblem bei den beiden obigen Befehlen ist, dass die doc-Datei keine Bilder in die Seiten einschließt, sondern nur den formatierten Text. Gibt es eine bessere Möglichkeit, PDF in doc umzuwandeln und dabei auch die im PDF vorhandenen Bilder einzuschließen? Ich bin nicht an Webdiensten wie zamzam interessiert, ich muss das über die Befehlszeile auf dem Server tun. Danke.
Antwort1
Sie könnten es mit der Software Abiword versuchen. Beispiel:
abiword --to=doc beispiel.pdf
Antwort2
Mir ist es gelungen, indem ich Folgendes verwendet habe:
libreoffice --infilter=="writer_pdf_import" --headless \
--convert-to doc:"writer_pdf_Export" Brief.pdf
Es gibt mir die gleiche Ausgabe wie die Antwort von @igiannak.
Antwort3
Jeder direkte Befehl der Befehlszeilenschnittstelle ist für die Konvertierung von PDF in DOCX verfügbar, einschließlich der im PDF vorhandenen Bilder. Ich habe die Befehle von LibreOffice und SOffice ausprobiert, aber es wurde nur einfacher formatierter Text ausgegeben, wie bei jeder anderen pywin32.com-Clientbibliothek, die unter Linux/Ubuntu für die Konvertierung von PDF in Word verfügbar ist.
Betriebssystem importieren System importieren
comtypes.client importieren
wdFormatPDF = 17
def covx_to_pdf(infile, outfile): """Konvertiert eine Word-DOCX-Datei in PDF"""
word = comtypes.client.CreateObject('Word.Application')
doc = word.Documents.Open(infile)
doc.SaveAs(outfile, FileFormat=wdFormatPDF)
doc.Close()
word.Quit()
Dieser Code funktioniert auf Windows-Rechnern für die Konvertierung von PDF in Word, aber dieses Paket unterstützt keine Linux-/Debian-Plattformen. Können wir einen Vorschlag für die gleiche Implementierung auf Linux/Debian für die Konvertierung von PDF in Word haben?