
저는 대용량 CSV 파일(700MB)에 데이터를 쓰는 프로그래밍 작업을 하고 있었습니다. 가끔 libre office를 이용해 파일을 열어서 들어오는 데이터를 확인하곤 했습니다.
오늘 아침에 파일을 작성하는 동안 파일을 열고 일부 데이터를 다른 빈 csv 파일에 복사하여 해당 파일에서 데이터를 올바르게 읽는 스크립트를 작성할 수 있으므로 큰 CSV 파일이 준비되면 준비할 수 있습니다. .
그러나 예제 행을 복사한 후 큰 파일을 닫았다가 몇 분 후에 다시 열었더니 이제 미리 보기에 내 데이터가 다음과 같이 표시됩니다.
내 데이터에 중국어나 일본어 문자가 전혀 없기 때문에 인상적입니다. libre office calc에서 파일을 열면 "셀에 문자가 너무 많습니다"라는 메시지가 표시되고 중단된 후 libre office가 충돌합니다.
올바른 단어 표시 및 모든 것. Python 스크립트를 사용하여 파일을 읽거나 텍스트 파일로 열면 행도 올바르게 표시됩니다. 이 이상한 오류는 무엇입니까?
답변1
알았어, 내가 바보같았어. 문자 집합이 유니코드로 변경됐는데 눈치채지 못했어.
도이.