Ordem de classificação do Windows Explorer para caracteres especiais?

Ordem de classificação do Windows Explorer para caracteres especiais?

Qual é a ordem de classificação usada no Windows Explorer?

Eu estava me perguntando especificamente que tipo de caracteres especiaisdepoisos alfabetos?

Pelo que posso dizer (teste), todos os caracteres especiais parecem estar classificados antes dos alfabetos. Mas não consegui identificar a ordem. (por exemplo, '@' vem depois de '%', o que não é assim no teclado)

Captura de tela

Existem caracteres especiais que seriam classificadosdepoisos alfabetos?

Responder1

Fiz alguns testes e a ordem geral parece ser a seguinte...

Símbolos
Latim (ordenado por valor Unicode (U+xxxx))
Grego (ordenado por valor Unicode (U+xxxx))
Cirílico (ordenado por valor Unicode (U+xxxx))
Hebraico (ordenado por valor Unicode (U+xxxx))
Árabe ( ordenado por valor Unicode (U+xxxx))

Números
Latim (ordenado por valor Unicode (U+xxxx))
Grego (ordenado por valor Unicode (U+xxxx))
Cirílico (ordenado por valor Unicode (U+xxxx))
Hebraico (ordenado por valor Unicode (U+xxxx))
Árabe ( ordenado por valor Unicode (U+xxxx))

Cartas
Latim (ordenado por valor Unicode (U+xxxx))
Grego (ordenado por valor Unicode (U+xxxx))
Cirílico (ordenado por valor Unicode (U+xxxx))
Hebraico (ordenado por valor Unicode (U+xxxx))
Árabe ( ordenado por valor Unicode (U+xxxx))

insira a descrição da imagem aqui


Classificando sequência de regras versus ordem observada

É importante notar que existem realmente duas maneiras de ver isso. Em última análise, o que você tem são regras de classificação que são aplicadas em uma determinada ordem, por sua vez, isso produz uma ordem observada. A ordenação das regras mais antigas torna-se aninhada na ordenação das regras mais novas. Isto significa que a primeira regra aplicada é a última regra observada, enquanto a última regra aplicada é a primeira ou a regra superior observada.

Sequência de regras de classificação

1.) Classificar por valor Unicode (U + xxxx)
2.) Classificar por cultura/idioma
3.) Classificar por tipo (símbolo, número, letra)

Ordem observada

  • O nível mais alto de agrupamento é por tipo na seguinte ordem...

    1.) Símbolos
    2.) Números
    3.) Letras

    Portanto, qualquer símbolo de qualquer idioma vem antes de qualquer número de qualquer idioma, enquanto qualquer letra de qualquer idioma aparece depois de todos os símbolos e números.

  • O segundo nível de agrupamento é por cultura/idioma. A seguinte ordem parece se aplicar a isso:

    Latim
    Grego
    Cirílico
    Hebraico
    Árabe

  • A regra mais baixa observada é a ordem Unicode, portanto os itens dentro de um grupo de linguagem de tipo são ordenados por valor Unicode (U+xxxx).

Responder2

As respostas fornecidas nesta discussão, embora interessantes, são um tanto esotéricas. A resposta simples é quenenhumdos símbolos são classificados após as letras (sem levar em consideração a forma especial 'como -são tratados, veja abaixo).

As outras respostas afirmam que os caracteres dos símbolos são classificados por valor Unicode. No entanto, para caracteres do Explorador de Arquivos do Windows 10 no bloco latino básico (caracteres ASCII), isso não é estritamente verdade.

A tabela a seguir de caracteres ASCII permitidos em nomes de arquivos (mostrando os caracteres, seus valores Unicode e uma descrição do caractere) está organizada na ordem de classificação usada pelo Windows 10 File Explorer.


Caracteres ASCII permitidos em nomes de arquivos
Listed in File Explorer's ascending sort order
           Unicode
Descrição do valor hexadecimal do caractere
--------- ------------ ----------------------------- -----------
! 0021 ponto de exclamação
#0023 sinal numérico
$ 0024 cifrão
Sinal de % 0025 por cento
& 0026 e comercial
(0028 parêntese esquerdo
) 0029 parêntese direito
, 002C vírgula
. 002E ponto/ponto final
; 003B ​​ponto e vírgula
@0040 arroba comercial
[005B colchete esquerdo
] 005D colchete direito
^ 005E acento circunflexo
_ 005F linha baixa, sublinhado
`0060 sotaque grave
{007B chave esquerda
} 007D chave direita
~ 007E til
+ 002B sinal de mais
= 003D sinal de igual
0-9 0030 – 0039 dígito zero ao dígito nove
A-z¹ 0041 – 005A, letras maiúsculas de A a Z
           0061 – 007Uma letra minúscula de a a z

Responder3

Para usuários do alfabeto latino que procuram um caractere para agrupar depois de quase todo o resto, você pode usar (como as respostas mais longas disseram) caracteres de outros alfabetos (grego, cirílico, hebraico, árabe)

Eu uso Omega ( Ω ) ou a última letra hebraica ( ת‎ ).

Responder4

Eles provavelmente são classificados pelo valor correspondente noTabela ASCII.

O algoritmo de classificação real é provavelmente mais complexo e também leva qualquer outraUnicodepersonagem em consideração. Mas o caractere mostrado nos seus exemplos aparece na tabela ASCII e seus valores (pelo menos a ordem) também são mapeados para Unicode.

informação relacionada