
西ヨーロッパと米国では、CP-1252 がデフォルトの文字エンコーディングであることは知っています。
他の Windows バージョンでのデフォルトの文字エンコーディングはどうですか?
また、最近、Windows 8 ではデフォルトの文字エンコードとして UTF-8 が使用されると聞きましたが、これは正しいでしょうか?
答え1
Windows は本質的に UTF-16 エンコードを使用します。Microsoft 用語で「既定のエンコード」または「既定のコードページ」は、多くの古いプログラムで使用されているレガシーエンコードです。たとえば、メモ帳では、ファイルを保存するときの既定のエンコードは「ANSI」ですが、これは (誤解を招くかもしれませんが) 既定のコードページを示しています (ただし、メモ帳は内部的には UTF-16 で動作します)。
システムロケールによってデフォルトのコードページが決まります。Windows ロケール コード - 並べ替え可能なリストマッピングが表示され、おそらく信頼できるでしょう。(これに関する Microsoft のページは見つかりませんでした。)
特に、ウェブブラウザは、エンコーディング情報が利用できない場合、ウェブページのエンコーディングとして決定されたデフォルトのコードページを使用する傾向があります。実際には、より複雑です。HTML5 LCでは、セクション文字コードの決定プロセスについて説明 (および規定) しており、ロケールからコードページへの Windows マッピングをほぼ反映したマッピング テーブルも含まれています。