メモ帳で txt ファイルのコンテンツが奇妙な記号として表示される

Question

このファイルは偽陽性メモ帳の「Unicodeかどうか」の検出で問題が発生します。（この問題は独自のWikipediaページ。

'intvar' が常にゼロの場合、ファイルは完全に繰り返しで構成され、 ASCII (および/または UTF-8) の"0\n"バイトとして保存されます。{0x30, 0x0A}
```
"0"  "\n"  "0"  "\n"  "0"  "\n"  ...
30   0A    30   0A    30   0A    ...
```
ご覧のとおり、Unicode文字"ਰ"aka "\u0A30"aka0A30 は、これはまた{0x30, 0x0A}UTF-16 LE のバイトとして保存されます。
```
"ਰ"     "ਰ"     "ਰ"    ...
30 0A   30 0A   30 0A  ...
```

出力を少し変更する（たとえば、何らかの「明らかに ASCII」のヘッダーやコメントを追加する）と、問題を回避できます。

ファイルの内容にプレフィックス"\xEF\xBB\xBF"(または"\uFEFF"、Java/Kotlin が推奨するスペル) を付けることもできます。これは、ファイルが UTF-8 であることを示す標準ヘッダーであり、メモ帳 (および他のすべてのテキストエディター) が自動検出をスキップするようになります。

Androidがサポートしている場合は、次のようにファイルを書き込むことができます。実際のUTF-16 (フォーマット検出のこの部分をバイパスできるように、BOM を含めることが望ましい)。

(他のファイルでは、少なくとも 1 つの値が 10 以上のため、バイトが「ずれて」検出コードに対して ASCII に近くなり、UTF-16 に近くなくなるため、おそらく問題は発生しません。)

Answer 1