
자바스크립트 파일을 편집할지 말지 딜레마에 빠졌습니다. gedit로 열면 다음 경고가 표시됩니다.
열어본 파일에 잘못된 문자가 일부 있습니다. 이 파일을 계속 편집하면 이 문서가 손상될 수 있습니다. 다른 문자 인코딩을 선택하고 다시 시도할 수도 있습니다.
현재 인코딩은 UTF-8입니다. 파일에 100,000줄이 넘는 코드가 포함되어 있는데 잘못된 문자를 빠르게 검색할 수 있는 방법이 있나요?
답변1
파일이 UTF-8이므로 실행할 수 있습니다isutf8. 추가 유틸리티 패키지. 잘못된 바이트에 대한 줄, 문자 및 오프셋을 모두 제공합니다.
그런 다음 xxd, hexdump 등을 사용하여 분석하십시오.
불행히도 첫 번째 충돌에서 중지됩니다. 하지만 다시 파일에 따라 다릅니다. 잘못된 바이트가 하나만 있을 수도 있습니다.)
유사한 분석을 수행하지만 전체 파일에 대해 수행하는 C 코드가 있습니다. 오랫동안 잊혀진 디스크 어딘가에 있습니다. 필요하다면 찾아보도록 할게요.
그렇지 않으면 예, 빠르고 그렇지 않습니다.저것더러운 방법은 좋은 Mr.이 제안한 대로 gedit로 저장된 복사본을 비교하는 것입니다.@본브랜드.