Tengo un conjunto de datos, recibidos en formato .csv, en el que tengo un conjunto de números UPRN largos. Estoy involucrado en procesos de comparación de datos relacionados con las nuevas regulaciones de votación del IER.
Cuando abro el archivo .csv, los números están en formato científico (2.00E+11, todos los números iguales). Se supone que todos estos números son diferentes. Para una hoja de cálculo ya hice lo siguiente:
Abrí el archivo en el Bloc de notas, lo guardé en .txt. Seleccione Datos > Desde texto. En el Asistente de importación de texto, Paso 1, elija Delimitado. En el Asistente de importación de texto, Paso 2, elija Coma. En el Asistente de importación de texto, Paso 3, seleccione su columna ID larga y Elija formato de datos de texto. Entonces termina.
Esto funcionó para una hoja de cálculo. Todos los números fueron revelados en una hoja de cálculo de Excel, todos los números eran diferentes como deberían ser. Pero cuando intenté guardar como .csv, todos los números volvieron a 2.00E+11 (todos el mismo número).
Luego, cuando intenté hacer lo anterior con los otros dos libros que tenía, por alguna razón no funcionó, aunque completé cada paso exactamente de la misma manera. Incluso cuando abrí en el bloc de notas, todos eran los mismos números (2.000E+11, que cuando los convertí a texto llegaron a 2000030000000). Logré convertir el .csv original en un libro de trabajo, convertirlo en un bloc de notas y cuando me desplacé hacia abajo por todos los símbolos pude ver que los datos originales estaban allí entre el desorden.
¿Cómo puedo hacer que estos datos se revelen? Cualquier sugerencia será recibida con gratitud o, de hecho, avíseme si hay un enlace a esto en otro lugar.
Muchas gracias
Respuesta1
Esto sucede porque Excel ve estas celdas como números, pero debido a que son tan largas, se interpretan como números de punto flotante. La precisión del formato numérico en Excel alcanza un máximo de 15 dígitos como se explicaaquí.
Lo que probablemente deberías hacer es manejar cada valor como un archivo string
. Agregar uno '
al principio de cada celda con datos debería solucionar este problema, o puede formatear todas las celdas como string
o text
.
Sin embargo, este método no está exento de limitaciones. Si va a procesar estos datos, es posible que necesite alguna forma de desinfectarlos antes de introducirlos en cualquier proceso.