いくつかの Unicode 文字を含む PDF ファイルがあります (画像を参照)。
これらの文字をクリップボードにコピーして、たとえば MS Word に挿入すると、文字が疑問符の付いた 1 つの四角形として表示されます。これは、該当するフォントがシステムにないためと考えられます。
私が欲しいのは、UTF の文字コードとその名前を取得することです。どうすれば取得できますか? 私が興味を持っている文字は次のとおりです。直接認識できるでしょうか? とにかく、PDF と Unicode の一般的なソリューションがあれば素晴らしいと思います。
答え1
MS Wordでは、カーソルを文字の直後に置き、Alt X(つまり、Altキーを押しながらXキーを押す)と入力します。Wordの比較的新しいバージョンでは、これで文字がUnicodeコード番号に変換されます。名前を取得するには、次のサイトにアクセスします。http://www.unicode.orgまたは、Windowsの文字コード表プログラムを使用することもできます。または、バベルパッドは、カーソルを各文字の直前に移動すると、その文字の Unicode 番号と Unicode 名が表示される優れた Unicode エディターです。
代わりに、もっと楽しくするために、http://shapecatcher.com/そして文字を描きます。単純なパターンの場合、これはかなり効果的です。私のかなり不器用な描画から、最初の文字が「右上の象限を持つ白い四角形」U+25F3 であることがすぐに認識されました。