Windows バージョンのデフォルトの文字終了コード

Windows バージョンのデフォルトの文字終了コード

西ヨーロッパと米国では、CP-1252 がデフォルトの文字エンコーディングであることは知っています。

他の Windows バージョンでのデフォルトの文字エンコーディングはどうですか?

また、最近、Windows 8 ではデフォルトの文字エンコードとして UTF-8 が使用されると聞きましたが、これは正しいでしょうか?

答え1

Windows は本質的に UTF-16 エンコードを使用します。Microsoft 用語で「既定のエンコード」または「既定のコードページ」は、多くの古いプログラムで使用されているレガシーエンコードです。たとえば、メモ帳では、ファイルを保存するときの既定のエンコードは「ANSI」ですが、これは (誤解を招くかもしれませんが) 既定のコードページを示しています (ただし、メモ帳は内部的には UTF-16 で動作します)。

システムロケールによってデフォルトのコードページが決まります。Windows ロケール コード - 並べ替え可能なリストマッピングが表示され、おそらく信頼できるでしょう。(これに関する Microsoft のページは見つかりませんでした。)

特に、ウェブブラウザは、エンコーディング情報が利用できない場合、ウェブページのエンコーディングとして決定されたデフォルトのコードページを使用する傾向があります。実際には、より複雑です。HTML5 LCでは、セクション文字コードの決定プロセスについて説明 (および規定) しており、ロケールからコードページへの Windows マッピングをほぼ反映したマッピング テーブルも含まれています。

関連情報