Excel: Altere a codificação padrão (origem do arquivo) do Assistente de importação de texto para UTF-8 (65001: Unicode)

Excel: Altere a codificação padrão (origem do arquivo) do Assistente de importação de texto para UTF-8 (65001: Unicode)

Estou usando uma variedade de ferramentas para preparar regularmente dados para a web. Uma etapa exige que eu abra um CSV no Excel, faça alterações e salve o arquivo.

Existe uma maneira de forçar o Excel a aceitar a codificação UTF-8 e salvar seus arquivos com essa codificação?

Responder1

Eu respondi a uma pergunta semelhante emCodificação de caracteres padrão para o Excel Text Wizard?.

Encontrei minha resposta emAlterando o tipo de origem de importação de texto padrão no Excel.

  1. Feche o Excel, se estiver aberto.
  2. Abra oEditor de registro.
  3. Navegar paraHKEY_CURRENT_USER → Software → Microsoft → Office → ▒▒ → Excel → Opções, onde ▒▒ é a sua versão do Office, provavelmente o maior número que você vê lá.
  4. Clique com o botão direito em um espaço vazio no lado direito e selecioneNovo → DWORD.
  5. Dê um nome ao itemCPG padrãoe pressione Enter para salvar.
  6. Clique com o botão direito emCPG padrãoe selecioneModificar.
  7. Colocou oBaseparaDecimal.
  8. ParaDados de valor, digitar65001para definir seu padrão para UTF-8. Para alguma outra codificação, use o identificador de página de código, que você pode encontrar no Assistente de Importação de Texto no Excel ou noesta lista.
  9. CliqueOK.

Como Vasille diz no comentário a esta pergunta, se o seu arquivo não estiver realmente no formato UTF-8, você pode tecnicamente querer converter os caracteres do arquivo para a codificação desejada antes de abrir no Excel. Para meus propósitos, porém, o UTF-8 faz um bom trabalho ao exibir caracteres não corrompidos.

Não está funcionando? Certifique-se de definir Base como Decimal (Etapa 7).

Captura de tela de Editar valor DWORD de 32 bits mostrando a configuração de base para decimal

Responder2

Parece queMarca de ordem de bytesé exigido pelo software Microsoft Office.

  1. Usando o Notepad++, converta o CSV usando o menu: Codificação -> Converter para UTF8-BOM.

  2. Usando o sedutilitário Unix, disponível emcmderouGit para Windows. VerAdicionando BOM a arquivos UTF-8.

    sed -i '1s/^/\xef\xbb\xbf/' file.csv
    

  • Testado com Excel 2016
  • Isso é o que avwtp quis dizer em seuresponder.

Responder3

Uma maneira fácil de alterar a codificação ANSI do Excel para UTF-8 é abrir o arquivo .csv no bloco de notas e selecionar Arquivo> Salvar como. Agora, na parte inferior, você verá que a codificação está definida para ANSI, altere-a para UTF-8 e salve o arquivo como um novo arquivo e pronto.

Responder4

Você precisa usar a File > Importopção e começar com um documento em branco e especificarUTF-8

insira a descrição da imagem aqui

mas isso está longe de ser o ideal para tornar essa configuração padrão para todos os arquivos; de qualquer forma, é desnecessário girar os arquivos no Google Drive ou no LibreOffice. Os padrões são simplesmente mal escolhidos e a incapacidade de mudar isso é irritante.

Relacionado

  1. Como definir a codificação de caracteres ao abrir o Excelmas não encontra a opção de alterar os padrões para que todos os arquivos sejam abertos automaticamente com UTF-8 em vez do formato Macintosh no OSX

  2. Como alterar a opção de arquivo padrão para UTF-8 da opção de arquivo Macintoshem Apple.SE.

informação relacionada