Windows エクスプローラーの特殊文字の並べ替え順序は?

Windows エクスプローラーの特殊文字の並べ替え順序は?

Windows エクスプローラーで使用される並べ替え順序は何ですか?

特に特殊文字が何に分類されるのか知りたいですアルファベットですか?

私が知る限り (テスト)、すべての特殊文字はアルファベットより前に並べられているようです。しかし、順序はわかりませんでした。(たとえば、「@」は「%」の後ですが、キーボードではそのようにはなっていません)

スクリーンショット

ソートされる特殊文字はありますか?アルファベットですか?

答え1

いくつかテストしてみましたが、全体的な順序は次のようになります...

シンボル
ラテン語 (Unicode 値 (U+xxxx) で順序付け)
ギリシャ語 (Unicode 値 (U+xxxx) で順序付け)
キリル文字 (Unicode 値 (U+xxxx) で順序付け)
ヘブライ語 (Unicode 値 (U+xxxx) で順序付け)
アラビア語 (Unicode 値 (U+xxxx) で順序付け)

数字
ラテン語 (Unicode 値 (U+xxxx) で順序付け)
ギリシャ語 (Unicode 値 (U+xxxx) で順序付け)
キリル文字 (Unicode 値 (U+xxxx) で順序付け)
ヘブライ語 (Unicode 値 (U+xxxx) で順序付け)
アラビア語 (Unicode 値 (U+xxxx) で順序付け)

手紙
ラテン語 (Unicode 値 (U+xxxx) で順序付け)
ギリシャ語 (Unicode 値 (U+xxxx) で順序付け)
キリル文字 (Unicode 値 (U+xxxx) で順序付け)
ヘブライ語 (Unicode 値 (U+xxxx) で順序付け)
アラビア語 (Unicode 値 (U+xxxx) で順序付け)

ここに画像の説明を入力してください


ソートルールの順序と観測順序

実際には、これを見るには 2 つの方法があることに注意してください。最終的には、特定の順序で適用される並べ替えルールがあり、これにより、観察される順序が生成されます。古いルールの順序は、新しいルールの順序の下にネストされます。つまり、最初に適用されたルールが最後に観察されるルールであり、最後に適用されたルールが最初または最上位の観察されるルールです。

ソートルールの順序

1.) Unicode 値 (U+xxxx) で並べ替え
2.) 文化/言語で並べ替え
3.) タイプ (記号、数字、文字) で並べ替え

観察された順序

  • グループ化の最高レベルは、次の順序でタイプ別になります...

    1.) 記号
    2.) 数字
    3.) 文字

    したがって、どの言語の記号もどの言語の数字よりも前に表示され、どの言語の文字もすべての記号と数字の後に表示されます。

  • 2 番目のレベルのグループ化は、文化/言語によるものです。これには次の順序が当てはまるようです。

    ラテン語
    ギリシャ語 キリル
    文字
    ヘブライ語
    アラビア語

  • 遵守される最低のルールは Unicode 順序であるため、タイプ言語グループ内の項目は Unicode 値 (U+xxxx) によって順序付けられます。

答え2

この議論で提示された答えは興味深いものですが、やや難解です。簡単な答えはなし記号は文字の後にソートされます(特別な方法は考慮されず'-処理されます。以下を参照してください)。

他の回答では、記号文字は Unicode 値によってソートされると述べられています。ただし、Windows 10 ファイル エクスプローラーの基本ラテン ブロックの文字 (ASCII 文字) の場合、これは厳密には当てはまりません。

ファイル名に使用できる ASCII 文字の次の表 (文字、その Unicode 値、および文字の説明を表示) は、Windows 10 ファイル エクスプローラーで使用される並べ替え順序で並べられています。


ファイル名に使用できる ASCII 文字
Listed in File Explorer's ascending sort order
           ユニコード
文字 16進値 説明
--------- ------------ ----------------------------------------
! 0021 感嘆符
# 0023 番号記号
$ 0024 ドル記号
% 0025 パーセント記号
& 0026 アンパサンド
( 0028 左括弧
) 0029 右括弧
, 002C カンマ
. 002E 終止符/ピリオド
; 003B セミコロン
@ 0040 商用アットマーク
[ 005B 左角括弧
] 005D 右角括弧
^ 005E 曲折アクセント
_ 005F 下線、下線
` 0060 重アクセント
{ 007B 左中括弧
} 007D 右中括弧
~ 007E チルダ
+ 002B プラス記号
= 003D 等号
0-9 0030 – 0039 0から9までの数字
A-z¹ 0041 – 005A、大文字のAからZ
           0061 – 007小文字のaからz

答え3

ラテン文字のユーザーが他のほとんどの文字の後に照合する文字を探している場合は、(長い回答で述べられているように)他のアルファベット(ギリシャ文字、キリル文字、ヘブライ文字、アラビア文字)の文字を使用できます。

私はオメガ ( Ω ) または最後のヘブライ文字 ( ת‎ ) を使用します。

答え4

それらはおそらく対応する値によってソートされているASCII テーブル

実際のソートアルゴリズムはおそらくもっと複雑で、他のユニコード文字を考慮に入れないでください。ただし、例に示されている文字は ASCII テーブルに表示され、その値 (少なくとも順序) は Unicode にもマップされます。

関連情報