如何取得PDF檔案中某些字元的Unicode代碼和符號名稱?

如何取得PDF檔案中某些字元的Unicode代碼和符號名稱?

我有一個包含一些 Unicode 字元的 PDF 檔案(見圖)。

在此輸入影像描述

我可以將這些字元複製到剪貼簿並插入到 MS Word 等中,我看到該字元是一個帶有問號的正方形,可能是因為我的系統上缺少相應的字體。

我想要的是獲取UTF 格式的字元代碼及其名稱。我怎樣才能得到它們?這是我感興趣的人物——也許人們可以直接認出他們?不管怎樣,如果有一個針對 PDF 和 Unicode 的通用解決方案就太好了。

答案1

在 MS Word 中,將遊標放在字元後面並輸入 Alt X(即,在按下 Alt 鍵的同時按 X 鍵)。在任何相當現代的 Word 版本中,這會將字元轉換為其 Unicode 代碼編號。要取得名稱,您可以訪問http://www.unicode.org例如,或使用 Windows 中的字元對映程式。或者你可以安裝通天塔,一個很棒的 Unicode 編輯器,當您將遊標移到每個字元之前時,它會顯示每個字元的 Unicode 編號和 Unicode 名稱。

或者,為了更有趣,您可以使用http://shapecatcher.com/並繪製角色。對於簡單的圖案,這是相當有效的。它立即識別出你的第一個字符是“右上象限的白色方塊”U+25F3,來自我相當笨拙的繪圖。

相關內容