긴 UPRN 번호 세트가 있는 .csv 형식으로 수신된 데이터 세트가 있습니다. 나는 새로운 IER 투표 규정과 관련된 데이터 매칭 프로세스에 참여하고 있습니다.
.csv 파일을 열면 숫자가 과학적인 형식(2.00E+11, 모든 숫자가 동일함)으로 표시됩니다. 이 숫자는 모두 달라야 합니다. 하나의 스프레드시트에 대해 나는 이미 다음 작업을 수행했습니다.
메모장에서 파일을 열고 .txt로 저장했습니다. 데이터 > 텍스트 선택 텍스트 가져오기 마법사 1단계에서 구분을 선택합니다. 텍스트 가져오기 마법사 2단계에서 쉼표를 선택합니다. 텍스트 가져오기 마법사 3단계에서 긴 ID 열을 선택하고 텍스트 데이터 형식을 선택합니다. 그런 다음 마무리합니다.
이것은 하나의 스프레드 시트에 적용되었습니다. 모든 숫자는 Excel 워크시트에 공개되었으며 모든 숫자는 예상대로 달랐습니다. 그런데 .csv로 저장하려고 하면 모든 숫자가 2.00E+11(모두 같은 숫자)로 돌아갔습니다.
그런 다음 내가 가지고 있는 다른 두 통합 문서에 대해 위의 작업을 수행하려고 시도했을 때 각 단계를 똑같은 방식으로 완료했지만 어떤 이유로 작동하지 않았습니다. 메모장에서 열어도 모두 같은 숫자였습니다(2.000E+11, 텍스트로 변환하면 2000030000000이 됩니다). 원본 .csv를 통합 문서로 변환하고 이를 메모장으로 변환한 후 모든 기호를 지나 아래로 스크롤했을 때 원본 데이터가 그 혼란 속에 있다는 것을 알 수 있었습니다.
이 데이터를 어떻게 공개할 수 있나요?! 어떤 제안이라도 감사히 받겠습니다. 또는 다른 곳에 이에 대한 링크가 있으면 알려 주시기 바랍니다.
많은 감사
답변1
이는 Excel에서 이러한 셀을 숫자로 인식하지만 너무 길기 때문에 부동 소수점 숫자로 해석되기 때문에 발생합니다. 설명된 대로 Excel의 숫자 형식 정밀도는 최대 15자리입니다.여기.
아마도 당신이 해야 할 일은 각 값을 string
. 데이터가 있는 모든 셀의 시작 부분에 단일을 추가하면 '
이 문제가 해결됩니다. 또는 모든 셀의 형식을 string
또는 으로 지정할 수 있습니다 text
.
그러나 이 방법에도 한계가 있는 것은 아닙니다. 이 데이터를 처리하려면 데이터를 어떤 프로세스에든 공급하기 전에 데이터를 정리할 수 있는 방법이 필요할 수 있습니다.