Backends PHP

웹개발자를 위한 문자 인코딩 기초 #2 – EUC-KR

한글 문자 인코딩

ASCII는 대소문자를 합하여도 52개 밖에 되지 않는 알파벳을 사용하는 영어를 위한 인코딩 방식이었습니다. 그러나 불행히도 아랍어·한자·한글과 같이 문자 개수가 많은 언어는 1바이트 만으로 표시하기에는 공간이 부족합니다.

이 때문에 2바이트를 사용하여 문자를 표시하는 인코딩 방식들이 언어마다 등장하기 시작하였습니다. 그 중에서 가장 유명한 것이 동아시아 언어들을 위하여 만들어진 Extended Unix Code(약칭 EUC)인데, 94개의 값을 2바이트씩 붙여서 사용하는 방법입니다. 이 방법으로 중국 간체를 위한 EUC-CN, 대만 번체를 위한 EUC-TW, 일본어를 위한 EUC-JP 등이 만들어졌습니다.

이 글에서 소개할 EUC-KR은 EUC 중에서도 한글을 위하여 만들어진 인코딩 방식이며, 현재도 널리 사용되고 있습니다.

(more…)

Continue reading