URL을항상UTF8로보내시오
대문|찾기|목록|바뀐글| 환경설정 E D R S I M H RSS

URL을 항상 UTF-8로 보내시오.

PuzzletDotOrg의 모든 위키에서는 페이지 이름이 한글일 경우 주소창에 EUC-KR이 아닌 UTF-8로 주소를 입력해야 합니다. 즉, 고급 옵션에서 "주소를 항상 UTF-8로 보냄"을 켜셔야 합니다. 다른 사이트를 위해서는 Albireo:URL을항상UTF8로보내지마시오가 최적설정이지만 PuzzletDotOrg에서만큼은 URL을 UTF-8로 보내주지 않으면 올바른 결과를 얻을 수 없습니다.

한글을 전산화해 주는 인코딩으로는 크게 두 가지가 있는데 처음엔 완성형과 조합형이었습니다. 한글로 표현할 수 있는 모든 글자는 첫소리 19 x 가온소리 21 x 끝소리 28 = 11172 개여야 하는데, 조합형은 그 조합을 모두 표현할 수 있는 반면 완성형은 그중 2350개밖에 표현할 수 없었습니다. DOS 시절에 아래아 한글 3.0(혹은 그보다 더 이전)의 추억이 있으신 분들이라면 기억하실 겁니다. "완성형에서는 '똠방각하'를 쓸 수 없다. 조합형을 쓰자."

세월이 흘러 지금은 EUC-KR과 유니코드(UniCode)계열의 인코딩이 주를 이루고 있습니다. EUC-KR은 기본 완성형을 그대로 쓴 반면 유니코드는 모든 글자를 표현할 수 있는 국제 표준(ISO 10646)이면서 다른 언어의 문자 영역을 해치지 않아 완성형과 조합형의 장점을 잘 융합했다고 평가되고 있습니다. UTF-8는 이 유니코드를 인코딩하는 방법의 하나로서, 유니코드를 쓴다고 하는 것은 거의 항상 UTF-8인코딩(혹은 UTF-16인코딩)을 쓴다는 것이 되며, 이것이 표준이므로 UTF-8을 쓰는 것이 당연하지만, MicrosoftWindows 측에서 EUC-KR의 변형인 CP949을 고집하고 있는 행태 때문에 아직도 CP949와 EUC-KR이 사라지지 않고 있습니다. 아직도 "뷁"이라고 치면 "뷁"이라고 써지는 게시판이 있는데 그것은 그 게시판의 한글코드가 EUC-KR이며, 뷁이라는 글자가 기본적인 2350개에 포함되지 않기 때문입니다. 물론 확장완성형을 지원한다면 해결될 수 있는 문제이지만 UTF-8를 쓸 경우 그런 문제가 원천적으로 일어날 일이 없습니다.

--PuzzletChung

한글코드 및 언어코드에 대한 이야기는 세계화와언어코드에서 계속됩니다.(정말?)

사실 EUC-KR이라면 얼마나 좋겠습니까? - 윈도우즈 98 이후부터는 UHC(확장완성형)을 쓰고, 많은 문서들이 EUC-KR의 탈을 뒤집어 쓴 UHC를 쓰더군요. UHC는 전산쟁이들에게 더더욱 골머리를 앓게하는 코드입니다. 정렬조차 제대로 되지 않습니다. --최종욱
수정했습니다. :) Perky:CodePage페이지에 자세한 설명이 있더군요. --PuzzletChung

InternetExplorer는 "URL을 항상 UTF-8로 보내시오."를 켜도 UTF-8로 안 보냅니다. :( --PuzzletChung

주소창에 페이지이름을 치지 마시고 Go 폼에 페이지이름을 치면 아무런 문제가 없을겁니다. UTF8을 켜고 안켜고에 상관 없이
아무 문제가 없게 됩니다.

See also:

고칠수 없음|찾기|쪽 지우기|비슷한 쪽| Valid XHTML 1.0! Valid CSS! powered by MoniWiki