Por que o Unicode não é usado para caracteres reservados do sistema de arquivos?

Question 1

Acho que a razão pela qual não são é o potencial de causar confusão. Se você tiver um caractere parecido com um "?" mas tem um código Unicode diferente - como você saberá a diferença?

Como você explicaria isso para alguém? "Você não pode ter um ponto de interrogação no nome do arquivo, mas pode ter algo que parece um ponto de interrogação, mas não é, e para digitá-lo você só precisa usar este 5 -combinação de teclas."?

Melhor (na minha opinião) excluí-los completamente e evitar erros.

Answer

Acho que a razão pela qual não são é o potencial de causar confusão. Se você tiver um caractere parecido com um "?" mas tem um código Unicode diferente - como você saberá a diferença?

Como você explicaria isso para alguém? "Você não pode ter um ponto de interrogação no nome do arquivo, mas pode ter algo que parece um ponto de interrogação, mas não é, e para digitá-lo você só precisa usar este 5 -combinação de teclas."?

Melhor (na minha opinião) excluí-los completamente e evitar erros.

Question 2

Os caracteres que não são permitidos em um nome de arquivo são:

<(menor que)
>(Maior que)
:(cólon)
"(citação dupla)
/(barra)
\(barra invertida)
|(barra vertical ou tubo)
?(ponto de interrogação)
*(asterisco)

de acordo comConvenções de nomenclatura da Microsoft.

Era a isso que você estava se referindo?

A razão é provavelmente porque seria muito difícil lidar com arquivos com esses caracteres no command.comshell antigo, por exemplo, ?também significa qualquer caractere, *também significa qualquer arquivo, etc.

Em vez de ensinar a todos como lidar com esses casos especiais, eles proibiram isso, facilitando a elaboração do roteiro.

Não haveria equivalentes Unicode para esses caracteres, e se houvesse um equivalente, ainda não resolveria esse problema: o ASCII existente ?e *ainda teria que funcionar como curingas, caso contrário todos teriam que reescrever seus scripts.

Answer

Os caracteres que não são permitidos em um nome de arquivo são:

<(menor que)
>(Maior que)
:(cólon)
"(citação dupla)
/(barra)
\(barra invertida)
|(barra vertical ou tubo)
?(ponto de interrogação)
*(asterisco)

de acordo comConvenções de nomenclatura da Microsoft.

Era a isso que você estava se referindo?

A razão é provavelmente porque seria muito difícil lidar com arquivos com esses caracteres no command.comshell antigo, por exemplo, ?também significa qualquer caractere, *também significa qualquer arquivo, etc.

Em vez de ensinar a todos como lidar com esses casos especiais, eles proibiram isso, facilitando a elaboração do roteiro.

Não haveria equivalentes Unicode para esses caracteres, e se houvesse um equivalente, ainda não resolveria esse problema: o ASCII existente ?e *ainda teria que funcionar como curingas, caso contrário todos teriam que reescrever seus scripts.

Question 3

Você pode usar o seguinte Unicode, que é semelhante ao original, sem riscos

Eles são válidos como nome do Windows:

« (U+00AB) em vez de < (menos que)
» (U+00BB) em vez de > (maior que)
։ (U+0589ou ÷ (U+00F7) ou ‡ (U+2021) em vez de: (dois pontos)
“(U+201C) em vez de " (aspas duplas)
⁄ (U+2044) em vez de / (barra)
∖ (U+2216) ou \ (U+FF3C) ou 〵 (U+3035) em vez de \ (barra invertida)
¦ (U+00A6) em vez de | (barra vertical ou tubo)
‽ (U+203D) ⁇ (U+2047) ¿(U+00BF) em vez de ? (ponto de interrogação)
☀ (U+2600) em vez de * (asterisco)

Obs: OTabela Unicodepermite pesquisar caracteres por descrição (como romano), o caractere real e também fornecer como referência outros caracteres relacionados (com a mesma aparência)

Encontre abaixo o nome do arquivo válido (copie e cole para experimentar; funciona no Windows 7 com o Windows Explorer e é exibido corretamente, desculpe, não é possível adicionar a captura de tela). Você notará que a aparência é diferente no Windows e dentro do navegador (mudança de fonte)

unicode 一 ☀ ¦ » ։∖ ‡〵 ÷╲ ‽ ⁇ ¿ ‰ ¢ π ∞ « ≈.txt

Algumas referências

www.theasciicode.com.ar/extended-ascii-code/copyright-symbol-ascii-code-184.html
http://www.theworldofstuff.com/characters/
http://unicode-table.com/en/#00A9
http://www.tedmontgomery.com/tutorial/altchrc-a.html
http://unicode-table.com/en/#enclosed-alphanumerics
https://stackoverflow.com/questions/8086375/what-character-to-use-to-put-an-item-at-the-end-of-an-alphabetic-list

NB: O Windows é compatível com Posix desde 1980 (de acordo com a Wikipedia), portanto, está em conformidade com RFCs posix, incluindo aquele que especifica nomes de arquivos.resposta na troca de pilhafornece um contexto mais amplo sobre RFC e quais caracteres são permitidos em nomes de arquivos

Answer

Você pode usar o seguinte Unicode, que é semelhante ao original, sem riscos

Eles são válidos como nome do Windows:

« (U+00AB) em vez de < (menos que)
» (U+00BB) em vez de > (maior que)
։ (U+0589ou ÷ (U+00F7) ou ‡ (U+2021) em vez de: (dois pontos)
“(U+201C) em vez de " (aspas duplas)
⁄ (U+2044) em vez de / (barra)
∖ (U+2216) ou \ (U+FF3C) ou 〵 (U+3035) em vez de \ (barra invertida)
¦ (U+00A6) em vez de | (barra vertical ou tubo)
‽ (U+203D) ⁇ (U+2047) ¿(U+00BF) em vez de ? (ponto de interrogação)
☀ (U+2600) em vez de * (asterisco)

Obs: OTabela Unicodepermite pesquisar caracteres por descrição (como romano), o caractere real e também fornecer como referência outros caracteres relacionados (com a mesma aparência)

Encontre abaixo o nome do arquivo válido (copie e cole para experimentar; funciona no Windows 7 com o Windows Explorer e é exibido corretamente, desculpe, não é possível adicionar a captura de tela). Você notará que a aparência é diferente no Windows e dentro do navegador (mudança de fonte)

unicode 一 ☀ ¦ » ։∖ ‡〵 ÷╲ ‽ ⁇ ¿ ‰ ¢ π ∞ « ≈.txt

Algumas referências

www.theasciicode.com.ar/extended-ascii-code/copyright-symbol-ascii-code-184.html
http://www.theworldofstuff.com/characters/
http://unicode-table.com/en/#00A9
http://www.tedmontgomery.com/tutorial/altchrc-a.html
http://unicode-table.com/en/#enclosed-alphanumerics
https://stackoverflow.com/questions/8086375/what-character-to-use-to-put-an-item-at-the-end-of-an-alphabetic-list

NB: O Windows é compatível com Posix desde 1980 (de acordo com a Wikipedia), portanto, está em conformidade com RFCs posix, incluindo aquele que especifica nomes de arquivos.resposta na troca de pilhafornece um contexto mais amplo sobre RFC e quais caracteres são permitidos em nomes de arquivos

Question 4

Você mesmo pode usar esses personagens agora. Mas presumo que você pretenda fazer com que o sistema operacional translitere automaticamente entre um ponto de interrogação ASCII, por exemplo, e um semelhante como ﹖ ( SMALL QUESTION MARK- UFE56). Eu realmente não acho que isso seja satisfatório, especialmente porque o Linux e outros, onde os únicos caracteres inválidos para nomes de arquivos são barra ( /) e nulo (ASCII 0), aceitam esses caracteres prontamente.

Leitura adicional:

Corrigindo nomes de arquivos Unix/Linux/POSIX: Caracteres de controle (como nova linha), traços iniciais e outros problemas
Artigo da Wikipédia sobreNomes de arquivos

Answer

Você mesmo pode usar esses personagens agora. Mas presumo que você pretenda fazer com que o sistema operacional translitere automaticamente entre um ponto de interrogação ASCII, por exemplo, e um semelhante como ﹖ ( SMALL QUESTION MARK- UFE56). Eu realmente não acho que isso seja satisfatório, especialmente porque o Linux e outros, onde os únicos caracteres inválidos para nomes de arquivos são barra ( /) e nulo (ASCII 0), aceitam esses caracteres prontamente.

Leitura adicional:

Corrigindo nomes de arquivos Unix/Linux/POSIX: Caracteres de controle (como nova linha), traços iniciais e outros problemas
Artigo da Wikipédia sobreNomes de arquivos

Por que o Unicode não é usado para caracteres reservados do sistema de arquivos?

Responder1

Responder2

Responder3

Responder4

informação relacionada