Word Importieren von HTML-Absatzstilen

Word Importieren von HTML-Absatzstilen

Hoffe, dass jemand eine Antwort hat. Ich arbeite seit einer Woche immer mal wieder daran.

Ziel:Konvertieren Sie ein altes Online-Blog (für den Eigentümer) in 10 Word-Dokumente mit insgesamt 3200 Seiten. Jeder Teil jedes Blogs hat eines von fünf Formaten (Titel, Datum, Typ, Zusammenfassung, Inhalt). Jedem Teil innerhalb der Dokumente ist derselbe Stil zugeordnet, sodass er nur über das Stylesheet angepasst werden kann (z. B. die Schriftgröße jedes Titels ändern).

Mein bisheriges Vorgehen:Ich habe jede Blogseite gescrapt und jeden Teil jeder Seite in einer Datenbank gespeichert. Meine Idee war, den gesamten Text aus der Datenbank zu exportieren, <SPAN class="...">...</SPAN>jeden Teil hinzuzufügen und als Textdatei zu speichern. Dann importiere ich die Textdatei in Word.

Ich binfasterfolgreich. Word importiert die Stile, fügt sie der Stilgalerie hinzu und importiert den Text, indem es den neuen Stil anwendet. Das Problem ist, dass der zur Galerie hinzugefügte Stil einCHARAKTERnur Stiltyp. Ich kann also die Schriftart ändern, aber nicht den Absatz. Kein Zeilenabstand, kein Absatzabstand, keine Zentrierung usw.
Egal, was ich versucht habe, ich kann Word nicht dazu bringen, es zu einemABSATZStiltyp, den ich brauche. Ich habe neben SPAN mehrere verschiedene Tags ausprobiert. Ich habe versucht, text-align: centerder Klasse ein hinzuzufügen, um Word zu zwingen, es als Absatzstil zu erkennen, aber es wird einfach ignoriert. Ich habe auch versucht, den neuen Stil vor dem Importieren in Word zu definieren, aber dann wird der Text einfach ohne Stil importiert.

Kann jemand helfen? Wenn Sie den Import selbst versuchen möchten, speichern Sie den folgenden Beispielcode in einer Textdatei und dann in Word:Einfügen – Objekt – Text aus Datei. Danke!

BEARBEITEN: Anhand einiger Beispielinhalte kann ich erkennen, dass das Tag <LI class ="...>als Absatzformattyp importiert wird. Ich weiß also, dass Word dazu in der Lage ist.

 <!DOCTYPE html>
<html>
  <head>
    <style>
      .articleTitle{
        font-family: Georgia;
        font-size: 16pt;
        text-align: center;
      }
   </style>
  </head>
  <body>
    <span class="articleTitle">A few of my favorite fruits</span><p/>
  </body>
</html> 

Antwort1

Wie wäre es, die Datei „styles.xml“ im Word-Dokument zu ändern, nachdem Sie es erstellt haben? Wenn Sie zu „Zip“ wechseln und dann „styles.xml“ extrahieren, können Sie die Eigenschaft für Ihre Stile in „w:type="paragraph"“ ändern. Ich habe einen kurzen Test mit einem leeren Word-Dokument durchgeführt, einen Zeichenstil erstellt, dann die XML geändert, das Dokument erneut geöffnet und es war ein Absatzstil, den ich dann ändern konnte. Experimentieren Sie natürlich nur mit einer Kopie Ihres Word-Dokuments, um zu sehen, was passiert.

verwandte Informationen