
Estaba haciendo un trabajo de programación que implicaba escribir datos en un archivo CSV grande (700 MB). De vez en cuando abrí el archivo usando libre office para verificar los datos que ingresaban.
Esta mañana abrí el archivo (mientras se escribía en él) y copié algunos datos en otro archivo csv vacío para poder escribir un script para leer los datos correctamente, de modo que pueda estar listo para cuando el archivo CSV grande esté listo. .
Sin embargo, después de copiar una fila de ejemplo, cerré el archivo grande y lo volví a abrir unos minutos más tarde y ahora mis datos se ven así en la vista previa:
Lo cual es impresionante ya que no tengo ningún carácter chino o japonés en mis datos. Al abrir el archivo en Libre Office Calc aparece el mensaje "demasiados caracteres en la celda", se cuelga y luego Libre Office falla.
Si miro el archivo en bash, se ve así:
Palabras correctas que se muestran y todo. Si leo el archivo usando una secuencia de comandos de Python o lo abro como un archivo de texto, también muestra las filas correctamente. ¿Qué es este extraño error?
Respuesta1
Vale, estaba siendo tonto, el conjunto de caracteres se cambió a Unicode y no me di cuenta.
Doy.