Word の HTML「段落」スタイルのインポート

Word の HTML「段落」スタイルのインポート

誰かが答えを持っていることを願っています。1 週間、断続的に取り組んできました。

ゴール:古いオンライン ブログ (所有者用) を、合計 3200 ページの 10 個の Word ドキュメントに変換します。各ブログの各部分には、5 つの形式 (タイトル、日付、タイプ、概要、コンテンツ) のうち 1 つがあります。ドキュメント内の各部分には、同じスタイルが関連付けられているため、スタイル シートのみで調整できます (つまり、各タイトルのフォント サイズを変更します)。

これまでの私のアプローチ:私は各ブログ ページをスクレイピングし、各ページの各部分をデータベースに保存しました。私の考えは、各部分に追加されたすべてのテキストをデータベースからエクスポートし<SPAN class="...">...</SPAN>、テキスト ファイルとして保存することです。次に、テキスト ファイルを Word にインポートします。

私はほとんど成功しました。Wordはスタイルをインポートしてスタイルギャラリーに追加し、新しいスタイルを適用したテキストをインポートします。問題は、ギャラリーに追加されたスタイルがキャラクタースタイルタイプのみ。フォントは変更できますが、段落は変更できません。行間、段落間隔、中央揃えなどはありません。
何を試しても、Wordでそれを変更することはできません。段落スタイル タイプは、私が必要としているものです。SPAN 以外のさまざまなタグを試しました。text-align: centerクラスに を追加して、Word に段落スタイルとして認識させるようにしましたが、無視されてしまいます。また、インポートする前に Word 内で新しいスタイルを定義しようとしましたが、テキストはスタイルなしでインポートされてしまいます。

誰か助けてくれませんか? 自分でインポートを試してみたい場合は、以下のサンプル コードをテキスト ファイルに保存し、Word で実行します。挿入 - オブジェクト - ファイルからのテキスト。 ありがとう!

編集: サンプル コンテンツを見ると、タグが段落スタイル タイプとしてインポートされていることがわかります<LI class ="...>。つまり、Word でそれが実行できることはわかっています。

 <!DOCTYPE html>
<html>
  <head>
    <style>
      .articleTitle{
        font-family: Georgia;
        font-size: 16pt;
        text-align: center;
      }
   </style>
  </head>
  <body>
    <span class="articleTitle">A few of my favorite fruits</span><p/>
  </body>
</html> 

答え1

Word ドキュメントを作成した後で、その中の styles.xml を変更するのはどうでしょうか。zip に変更して、styles.xml を抽出すれば、スタイルのプロパティを w:type="paragraph" に変更できます。空の Word ドキュメントで簡単なテストを行い、文字スタイルを作成し、xml を変更して、ドキュメントを再度開くと、段落スタイルになっていて、それを変更できました。もちろん、Word ドキュメントのコピーでのみ実験して、何が起こるかを確認してください。

関連情報