誰かが答えを持っていることを願っています。1 週間、断続的に取り組んできました。
ゴール:古いオンライン ブログ (所有者用) を、合計 3200 ページの 10 個の Word ドキュメントに変換します。各ブログの各部分には、5 つの形式 (タイトル、日付、タイプ、概要、コンテンツ) のうち 1 つがあります。ドキュメント内の各部分には、同じスタイルが関連付けられているため、スタイル シートのみで調整できます (つまり、各タイトルのフォント サイズを変更します)。
これまでの私のアプローチ:私は各ブログ ページをスクレイピングし、各ページの各部分をデータベースに保存しました。私の考えは、各部分に追加されたすべてのテキストをデータベースからエクスポートし<SPAN class="...">...</SPAN>
、テキスト ファイルとして保存することです。次に、テキスト ファイルを Word にインポートします。
私はほとんど成功しました。Wordはスタイルをインポートしてスタイルギャラリーに追加し、新しいスタイルを適用したテキストをインポートします。問題は、ギャラリーに追加されたスタイルがキャラクタースタイルタイプのみ。フォントは変更できますが、段落は変更できません。行間、段落間隔、中央揃えなどはありません。
何を試しても、Wordでそれを変更することはできません。段落スタイル タイプは、私が必要としているものです。SPAN 以外のさまざまなタグを試しました。text-align: center
クラスに を追加して、Word に段落スタイルとして認識させるようにしましたが、無視されてしまいます。また、インポートする前に Word 内で新しいスタイルを定義しようとしましたが、テキストはスタイルなしでインポートされてしまいます。
誰か助けてくれませんか? 自分でインポートを試してみたい場合は、以下のサンプル コードをテキスト ファイルに保存し、Word で実行します。挿入 - オブジェクト - ファイルからのテキスト。 ありがとう!
編集: サンプル コンテンツを見ると、タグが段落スタイル タイプとしてインポートされていることがわかります<LI class ="...>
。つまり、Word でそれが実行できることはわかっています。
<!DOCTYPE html>
<html>
<head>
<style>
.articleTitle{
font-family: Georgia;
font-size: 16pt;
text-align: center;
}
</style>
</head>
<body>
<span class="articleTitle">A few of my favorite fruits</span><p/>
</body>
</html>
答え1
Word ドキュメントを作成した後で、その中の styles.xml を変更するのはどうでしょうか。zip に変更して、styles.xml を抽出すれば、スタイルのプロパティを w:type="paragraph" に変更できます。空の Word ドキュメントで簡単なテストを行い、文字スタイルを作成し、xml を変更して、ドキュメントを再度開くと、段落スタイルになっていて、それを変更できました。もちろん、Word ドキュメントのコピーでのみ実験して、何が起こるかを確認してください。