Tenho um conjunto de dados recebidos em formato .csv, no qual possuo um conjunto de números UPRN longos. Estou envolvido em processos de correspondência de dados relacionados aos novos regulamentos de votação do IER.
Quando abro o arquivo .csv os números estão em formato científico (2.00E+11, todos os números são iguais). Todos esses números deveriam ser diferentes. Para uma planilha eu já fiz o seguinte:
Abri o arquivo no Bloco de Notas, salvei em .txt Selecione Dados> Do Texto No Assistente de Importação de Texto Etapa 1, escolha Delimitado No Assistente de Importação de Texto Etapa 2, escolha Vírgula No Assistente de Importação de Texto Etapa 3, selecione sua coluna de ID longa e escolha Formato de dados de texto. Então termine.
Isso funcionou para uma planilha. Todos os números foram revelados em uma planilha Excel, todos os números eram diferentes como deveriam ser. Mas quando tentei salvar como .csv, todos os números voltaram para 2.00E+11 (todos o mesmo número).
Então, quando tentei fazer o que foi dito acima com as outras duas pastas de trabalho que eu tinha, por algum motivo não funcionou, embora eu tenha concluído cada etapa exatamente da mesma maneira. Mesmo quando abri no bloco de notas, eram todos os mesmos números (2.000E+11, que quando converti para texto só veio para 2000030000000). Consegui converter o .csv original em uma pasta de trabalho, convertê-lo em um bloco de notas e, quando rolei para baixo, passando por todos os símbolos, pude ver que os dados originais estavam ali no meio da bagunça.
Como posso fazer com que esses dados sejam revelados?! Qualquer sugestão recebida com gratidão ou, por favor, deixe-me saber se há um link para isso em outro lugar.
Muito obrigado
Responder1
Isso acontece porque o Excel vê essas células como números, mas por serem tão longas, estão sendo interpretadas como números de ponto flutuante. A precisão da formatação de números no Excel atinge no máximo 15 dígitos, conforme explicadoaqui.
O que você provavelmente deveria fazer é tratar cada valor como um arquivo string
. Adicionar um único '
no início de cada célula com dados deve resolver esse problema, ou você pode formatar todas as células como um string
ou text
.
Este método tem suas limitações, no entanto. Se você for processar esses dados, talvez seja necessário encontrar alguma maneira de higienizá-los antes de alimentá-los em qualquer coisa que os processe.