ANSI 또는 UTF8 파일입니까?

ANSI 또는 UTF8 파일입니까?

메모장에서 다음 배치 파일을 편집했습니다. 메모장 오른쪽 하단에 "UTF8"이 표시되었습니다. 파일을 ANSI 형식으로 저장했습니다.

이제 메모장의 오른쪽 하단에 "ANSI"가 표시되었습니다. 파일을 닫았다가 다시 열었습니다. 메모장 오른쪽 하단에 "UTF8"이 표시되었습니다. 위의 과정을 여러번 반복했는데 매번 같은 결과를 얻었습니다.

ANSI 파일인가요, 아니면 UTF8 파일인가요?

아니면 메모장의 오른쪽 하단에 표시된 내용이 아무 의미가 없을 수도 있나요?

이는 Windows 11 Pro 23H2 빌드 22631.3296 Windows 기능 경험 팩 1000.22687.1000.0에 있습니다. 윈도우 메모장 11.2401.26.0

[죄송합니다! 파일을 추가하는 것을 잊었습니다.]

date /t >C:\health.txt
time /t >>c:\health.txt
sfc /scannow >>c:\health.txt
time /t >>c:\health.txt
sfc /scannow >>c:\health.txt
time /t >>c:\health.txt

답변1

ANSI 파일인가요, 아니면 UTF8 파일인가요?

둘 다

ASCII 문자만 포함된 경우 ANSI 및 UTF-8이 모두 포함됩니다.

또한 대부분의 다른 문자 집합 및 인코딩이기도 합니다. 이는 대부분의 인코딩에 ASCII 코드 포인트(숫자 값)를 사용하는 ASCII 세트가 포함되어 있기 때문입니다.

예외는 한때 매우 일반적이었던 IBM의 EBCDIC와 같은 문자 인코딩입니다.


여담으로, 마이크로소프트는 역사적으로 ANSI라는 용어를 ANSI(American National Standards Institute)가 자사의 여러 표준 중 하나로 발표할 것으로 기대하는 문자 집합을 지칭하는 데 사용했습니다. ANSI는 그렇게 하지 않았습니다. 더 정확하거나 유용한 이름은 다음과 같습니다.코드 페이지 1252. ANSI로 파일을 작성했다고 말하는 것은 주방을 Pantone이나 RAL 색상으로 칠했다고 말하는 것과 비슷합니다.

Microsoft 응용 프로그램은 일반적으로 해당 응용 프로그램이 UTF-16LE, UTF-16BE 및 UTF-8과 같은 다양한 유니코드 인코딩을 인식하는 데 도움이 되는 BOM(바이트 순서 표시)을 사용하여 UTF-8 파일을 작성합니다. UTF-8 파일의 BOM은 파일 콘텐츠 인코딩을 식별하는 역할만 하며 UTF-8에는 적용할 수 없으므로 바이트 순서를 나타낼 수 없습니다. 텍스트 파일에 BOM이 있으면 문제가 발생할 수 있습니다. 예를 들어 BOM이 스크립트 실행 가능 서명을 대체하기 때문에 Linux 쉘 스크립트가 작동하지 못하게 되는 등의 문제가 발생할 수 있습니다 #!.

Microsoft 응용 프로그램은 라이브러리 기능을 사용하여추측하다파일 내용에서 파일 인코딩. 이는 시간이 지남에 따라 개선되었지만 신뢰할 수 없는 것으로 악명이 높습니다.

관련된

답변2

나는 그것이 중요하지 않다고 생각합니다. 영어 텍스트만 포함된 파일은 ASCII인 경우가 많으며 (표시되지 않은) UTF-8과 ASCII/ANSI 사이에는 차이가 없습니다.

파일을 강제로 UTF-8로 만들려면 BOM을 사용하여 UTF-8로 저장해야 합니다. BOM(파일 시작 부분에 있는 특수 표시인 "바이트 순서 표시")이 없으면 편집자는 추측해야 하며, 파일에 특수 문자(예: ä, ö와 같은 영어가 아닌 발음 구별 부호)가 없는 경우 또는 ê) 모든 공통 문자표의 처음 128자는 동일하므로 중요하지 않습니다.

답변3

이 UTF-8 메모장 표시는 가짜입니다. ANSI와 UTF-8로 텍스트 파일을 저장했는데 두 파일이 완전히 동일했습니다.

메모장의 UTF-8 구현에는 일관성이 심각하게 부족한 것 같습니다. UTF-8 형식으로 저장하려면 바이트 순서 표시(BOM) 파일의 시작 부분으로 이동하지만 그렇지 않습니다.

ANSI와 UTF-8(BOM 포함 또는 제외) 간의 차이를 올바르게 처리하려면 더욱 발전된 텍스트 편집기가 필요합니다. 예를 들어 메모장++.

관련 정보