Word 匯入 HTML「段落」樣式

Word 匯入 HTML「段落」樣式

希望有人能解答。斷斷續續地工作了一個星期。

目標:將舊的線上部落格(為所有者)轉換為 10 個 Word 文檔,總計 3200 頁。每個部落格的每個部分都有 5 種格式中的一種(標題、日期、類型、摘要、內容)。文件中的每個部分都將具有與之關聯的相同樣式,因此只能透過樣式表進行調整(即更改每個標題的字體大小)。

到目前為止我的方法:我已經抓取了每個部落格頁面,並將每個頁面的每個部分保存在資料庫中。我的想法是從資料庫中導出所有文本,<SPAN class="...">...</SPAN>添加到每個部分並保存為文本文件。然後將文字檔案匯入Word。

我是幾乎成功的。 Word 匯入樣式並將其新增至樣式庫並匯入已套用新樣式的文字。問題是添加到畫廊的樣式是性格僅樣式類型。所以我可以改變字體,但不能改變段落。沒有行間距,沒有段落間距,沒有居中等等
段落風格類型,這就是我需要的。除了 SPAN 之外,我還嘗試了幾種不同的標籤。我嘗試text-align: center在類別中添加 a 以強制 Word 將其視為段落樣式,但它只是被忽略。我還嘗試在匯入之前在 Word 中定義新樣式,但隨後文字只是匯入而沒有任何樣式。

有人能幫忙嗎?如果您想自己嘗試匯入,請將下面的範例程式碼儲存到文字文件,然後儲存到 Word 中:插入 - 物件 - 文件中的文本。謝謝!

編輯:由於一些範例內容,我可以看到標籤<LI class ="...>會作為段落樣式類型匯入。所以我確實知道 Word 能夠做到這一點。

 <!DOCTYPE html>
<html>
  <head>
    <style>
      .articleTitle{
        font-family: Georgia;
        font-size: 16pt;
        text-align: center;
      }
   </style>
  </head>
  <body>
    <span class="articleTitle">A few of my favorite fruits</span><p/>
  </body>
</html> 

答案1

建立Word文檔後修改styles.xml怎麼樣?如果您變更為 zip,然後提取 styles.xml,您可以將樣式的屬性變更為 w:type="paragraph"。我用一個空白的 Word 文件進行了快速測試,創建了一個字元樣式,然後修改了 xml,重新開啟了該文檔,這是一個我可以修改的段落樣式。顯然,只能嘗試使用 Word 文件的副本來看看會發生什麼。

相關內容