텍스트 문서를 파싱하는 작업을 하고 있는데요, 혹시 소스코드에서 파일을 열기 전에, 혹은 열고 난 후에 .txt 파
일의 저장 포맷이 ANSI 인지 유니코드인지 알 수 있는 방법이 있을까요?
텍스트 파일 저장 포맷 관련
Moderator: 류광
Re: 텍스트 파일 저장 포맷 관련
유니코드 포맷도 UTF-16, UTF-8 등 여러가지인데요..planar210 wrote:텍스트 문서를 파싱하는 작업을 하고 있는데요, 혹시 소스코드에서 파일을 열기 전에, 혹은 열고 난 후에 .txt 파
일의 저장 포맷이 ANSI 인지 유니코드인지 알 수 있는 방법이 있을까요?
UTF-16 혹은 UCS-2라면 선두에 BOM마크를 체크하면 판별할수 있습니다.
UTF-8의 경우, BOM마크를 체크해서 존재하면, UTF-8로 바로 간주가 가능하겠지만...
UTF-8에도 BOM마크를 전혀 쓰지 않는 경우도 많기 때문에, 이런 경우엔 일일이 체크해서 찾는것 같습니다..
검색했더니 다음과 같은 좋은 예시가 있더군요..링크 걸었습니다.
http://www.winapi.co.kr/project/dangeun/dg2/dg121.htm