최근 수정 시각 : 2024-07-01 14:45:50

완성형/중복 한자

중복 한자에서 넘어옴
파일:상위 문서 아이콘.svg   상위 문서: 완성형
파일:漢.svg파일:漢_White.svg 한자
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 닫기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#eee,#333> 서체와 자형 갑골문 · 금문 · 전서 · 예서 · 해서 · 행서 · 초서 · 정자(표준자형) · 간체자(간체자 논쟁) · 신자체(목록 · 변화 규칙) · 본자 · 속자 · 약자 · 이체자 · 한중일 한자
성질과 분류 획(필순) · 구조 · 파자 · 육서 · 상형자 목록 · 훈음 · 부수 · 부수(중국) · 부수(설문해자)
표준화 상용한자 (한문 교육용 기초 한자 · 통용규범한자표 · 당용한자 · 일본의 상용한자 (목록) · 학년별한자배당표) · 한국어문회 한자검정시험 · 어문회 급수 · 대한검정회 한자급수자격시험 · 검정회 급수 · 한자한문지도사시험 · 인명용 한자표 · 광동어 정음 운동
주음·표음화·한자음 반절 · 주음부호 · 병음 (한어병음 · 월어병음) · 한글(동국정운) · 훈독 · 음독 · 속음 · 한국 한자음 · 중국 한자음 (문백이독 · 상고음 · 중고음 · 근고음 · 양안 간 독음) · 일본 한자음 · 베트남 한자음 · 다음자
옥편 자전 · 설문해자 · 강희자전 · 옥편 · 이아 · 운서 · 광운 · 절운 · 집운 · 오음편해 · 한어대사전 · 대한화사전 · 중문대사전 · 이체자자전 · 한한대사전
색인 부수별 · 음별 · 획수별
국가별 사용 한자문화권 · 한문 · 백화문 · 한국의 한자 사용 · 한자어(한국식 한자어 · 중국식 한자어 · 일본식 한자어 · 베트남식 한자어) · 언어간 동형이의 한자어(고유명사) · 언어간 이형동의 한자어 · 우리말 새김
파생 문자 한글 전 한국어 표기 (국자 · 이두 · 향찰 · 구결) · 방언자 · 주음부호 · 가나 (히라가나 · 가타카나 · 헨타이가나 · 만요가나) · 측천문자 · 쯔놈 · 고장자 ·거란 문자 · 여진 문자 · 서하 문자
입력 · 검색 한자/입력기 · 창힐수입법 (목록) · 오필자형수입법 · 대이수입법 · 사각호마검자법
전산화 KS X 1001 · KS X 1002 · KPS 9566 · GB 2312 · JIS X 0208 · Big5 / 유니코드: 한중일 통합 한자 · BMP(통합 한자 · 통합 한자 확장 A · 호환 한자) · SIP(통합 한자 확장 B~F) · TIP(통합 한자 확장 G) · 한자 모양 설명 문자
기타 고사성어 · 천자문 · 한시 · 어조사 · 음역 · 서예 · 올해의 사자성어 · 올해의 한자 · 국한문혼용체(논쟁) · 국한문병용체 · 한자 교육 (한문(교과) (2022 개정 교육과정/한문과) · 한자 교육 찬반 논쟁) · 중복 한자 · 벽자 · 통자 · 갖은자 · 한자오자 · 미상 한자 · 유령 문자 · 특이한 한자 · 닮은꼴 한자 · 국호 · 주기율표 · 음률 · 한자문화권 고유명사 표기 · 자주 틀리는 한자어 · 훈을 혼동하기 쉬운 한자 · 부수를 혼동하기 쉬운 한자 · 한자를 혼동하기 쉬운 단어 · 발음이 여럿인 한자어 · 한국의 성씨(인구분포 · 지역별) · 후리가나 · 창작 한자 }}}}}}}}}

한글 전산화
<colbgcolor=#dddddd,#212121> 한글 인코딩 조합형 · 완성형(한글 목록 · 중복 한자 · CP949) · 조합형 완성형 논쟁 · 남북한 한글 코드의 충돌 문제 · 한컴 2바이트 코드 · 한글 채움 문자() · 유니코드 · 옛한글
타자기 키보드 두벌식 · 세벌식(일반 자판 · 속기 자판) · 휴대전화 입력기 · 한영 키

1. 개요2. 한자를 중복 배당한 이유3. 문제점 및 결점4. 유니코드에서의 처리5. 다른 언어 문자 코드와의 호환 문제6. 중복 한자 목록
6.1. 두 번 중복(일반)6.2. 두 번 중복(두음)6.3. 세 번 중복6.4. 네 번 중복
7. 관련 문서

1. 개요

KS X 1001 완성형(이하 KS 코드)은 독음이 여러 개인 일부 한자를 그 독음 수만큼 중복 배당했다. 예를 들어 의 경우 '락', '악', '요' 셋에다가 두음 법칙을 적용한 '낙'까지 해서 총 4개의 코드에 중복 배당돼 있다. 졸지에 닮은꼴 문자가 생겨난 셈.

일본이나 중국, 대만, 심지어 북한조차도 이런 식으로 한자를 중복 배당하지 않았다. 일본어의 한자 독음은 한국어보다 다양하므로[1] 만약 일본이 JIS 코드에 KS 코드와 같은 식으로 한자를 독음 수만큼 중복 배당했다면 JIS 코드와 유니코드의 호환용 한자가 수십 개나 존재했을 것이다.[2]

2. 한자를 중복 배당한 이유

한자 부호 표준시안에 포함시킬 수 있는 문자는 4,888자로 제한되었으므로 자종을 최대화 시키기 위해서는 모든 한자를 한번씩만 배열하는게 바람직하다. 그러나 동자이음자(예. 更경, 갱 度도, 탁)와 두음법칙 관련자(예. 樂낙, 락 女녀, 여)의 경우 각 문자를 한번씩만 배열하면 한자자료의 입출력은 소프트웨어적으로 가능하게 할 수 있으나 자료의 검색 및 Sorting은 매우 힘들어진다. (중략) 따라서 본 연구에서는 분포도, 관련도 및 유용도를 고려해서 꼭 필요하다고 생각되는 동자이음자와 두음법칙 관련자는 한번 이상씩 배열시켰다.
- 「한글·한자 코드 표준화에 관한 연구」, 한국표준연구소

완성형 표준을 제정하던 당시 발간된 보고서에 의하면 자료의 검색과 정렬의 용이를 위해 동자이음자와 두음 법칙 관련자를 중복 배당했다고 해설하고 있다. 수많은 한자 중 4888자의 제한 내에 수록될 한자를 고르기 위해 14가지의 자료 분포도를 기반으로 연구진의 검토를 거쳐 한자를 수록했으며, 중복 배당 한자도 같은 원리로 제한된 공간 내에서 최소한 필요한 문자를 선정했음을 밝히고 있다.

3. 문제점 및 결점

이와 같이 발음이 다르다고 같은 문자를 일부러 중복 배당하는 것은 영어에서 father, that, about 등의 a의 발음이 모두 [ɑ(ː)], [æ], [ə]로 다르니 a를 여러 번 중복 배당하는 것[3]한국어에서 '물기'의 '고([꼬])'와 '불기'의 '고([고])'의 발음이 다르니 '고'를 두 번 중복 배당하는 것과 다를 바가 없다. 그 어떤 문자 코드도 발음이 다르다고 문자를 중복 배당하지는 않았다.

이로 인해 생기는 문제점 및 결점은 다음과 같다.

첫째, 똑같아 보이는 문자가 내부 코드상으로는 다르게 처리되다 보니 문자열 검색이나 비교 등에서 오히려 불편을 초래한다(실제 사례).[4]

또한 같은 한자가 여러 개의 코드 값을 가진다는 것을 모르는 사람이 대부분이라는 것이다. 예를 들어, 年金(연금)이라는 단어를 입력할 때 누군가는 '연금'으로 변환해서 입력할 수도 있고 누군가는 年의 본 음가인 '년금'으로 변환해서 입력할 수도 있다. 그리고 이 중복 한자 문제를 아는 사람은 '년김'으로 변환해서 입력할 수도 있다. 즉 작업자가 누구냐에 따라 똑같은 한자 단어를 다른 코드로 입력하게 되고 만다.

둘째, 위의 연구 보고서에서도 밝히는 바와 같이 중복 배당자는 제한된 공간에서 최소한의 필요자만 선정되었으므로 이 중복 배당이 모든 독음을 커버하는 것도 아니다. 예를 들어[5] 初八日(), 六月(), 十月(), 瓜(), 困難(곤), 乖愎(괴), 娑婆(사), 邯鄲之夢(단지몽), 唵川面(천면), 紙杻驛() 등의 '파', '유', '시', '모', '란', '팍', '바', '한', '옴', '축' 등에는 별개의 코드가 주어지지 않았으며, 亘(긍, 선)은 '긍'만 고려되었고 射(사, 석, 야, 역)는 '사'만 고려되었고 敦(단, 대, 돈, 조, 퇴)은 '돈'만 고려되었다. 그리고 사이시옷을 넣는 6개 한자어 庫間(간), 貰房(방), 數字(), 車間(간), 退間(간), 回數(수)에서 등장하는 사이시옷이 추가된 한자음 '곳', '셋', '숫', '찻', '툇', '횟'에도 별개의 코드가 주어지지 않았다.

이러한 이유로 두음법칙용 문자의 일관성도 없는 상황이다. 똑같은 독음을 가진 한자인데 어떤 것은 두음 법칙을 적용해서 중복 배당하고 어떤 것은 두음 법칙도 적용하지 않고 중복 배당하지도 않았다. 예를 들어 KS 코드에서 '력'이라는 독음을 가진 한자는 力, 曆, 歷, 瀝, 礫, 轢, 靂이 존재하는데, 이 중에서 力, 曆, 歷, 轢은 '력'뿐만 아니라 두음 법칙을 적용한 '역'이라는 독음으로도 중복 배당돼 있지만, 瀝, 礫, 靂은 오로지 '력'으로만 존재하고 '역'으로는 존재하지 않는다. 그래서 力學(역학)의 力은 '역'으로 변환해서 '역' 전용 (호환용) 한자를 입력할 수 있지만, 礫巖(역암)의 礫은 '력'으로만 변환·입력해야 한다. 즉 독음에 따라 같은 한자를 중복 배당한 게 실질적으로 별 도움이 되지 않는다.

이미 중복 배당된 한자를 사용할 방법을 굳이 생각해 보자면 '한자→한글' 변환을 생각해볼 수 있을것이다.[6] 가령 한자 '李'가 '리'에만 등록되어 있다면 한자명 '李哲秀'를 도로 한글로 변환했을 때 '리철수'가 된다. 대한민국 맞춤법에서는 두음 법칙을 인정하고 있으므로 '이철수'로의 변환을 보장하기 위해 '리'에 해당되는 '李'와는 별도로 '이'에 해당되는 '李'를 만들어 배당해 두고, '한글→한자' 변환 시에는 '이'→'李('이' 전용)', '한자→한글' 변환 시에는 '李('이' 전용)'→'이'의 과정을 따르게끔 사용할 수도 있을 것이다. 하지만 정작 이런 방식으로 쓰는 곳도 없을뿐더러, 차라리 문자 코드상으로는 한자를 중복 배당하지 않고, 한자 '李'를 한글로 변환할 때에는 '리'나 '이'라는 후보가 뜨게끔 했다면 훨씬 나았을 것이다.[7]

그리고 어차피 '한자→한글' 변환은 상술한 '十月'→'시월', '邯鄲之夢'→'한단지몽', '數字'→'숫자' 같은 경우 때문에 별도의 단어 사전이 필요하다. 또한 '한자어+고유어' 구조의 합성어에서 한글 철자에 추가되는 사이시옷을 제대로 처리하려면 단어 사전에 한자와 한글이 섞인 단어도 집어넣어야 한다(예: '齒솔'→'칫솔', '空器밥→'공깃밥', '問題거리'→'문젯거리' 등). 형태소로만 따지면 '칫솔'과 같은 경우 '齒+ㅅ+솔'이므로, 흡사 중세 국어 문헌처럼 '齒ㅅ솔'과 같은 형태를 기준으로 하면 문제가 없겠으나, 현대 맞춤법에서는 음절별로 모아 쓰게 되어 있으므로 음절 말 자음, 즉 종성이 없는 한자의 받침에 사이시옷이 들어가는 경우까지 고려해야 한다. 결국 이러나 저러나 '한자→한글' 변환은 별도의 단어 사전으로 해결해야 한다는 말이다. 그리고 '한자→한글' 변환 시 두음 법칙이 적용된 음은 한자의 본음으로부터 기계적으로 생성해 낼 수 있기 때문에 두음 법칙은 굳이 중복 배당이 필요한 사항도 아니다.

그리고 '한글→한자' 변환 시, 문자 코드상으로 '李'가 하나만 있더라도 '이'를 변환할 때 나오는 후보에 '李'를 추가해 놓으면 그만이다. 실제로 중국어 입력기와 일본어 입력기는 이렇게 한다.
  • 중국어 입력기는 快乐(kuài)에도 音乐(yīnyuè)에도 코드까지 정확히 똑같은 글자(유니코드: U+4E50, GB 2312-80: 32-54 (EUC-CN/CP936: 0xC0D6))를 사용한다. 乐는 중국의 기본 문자 코드 GB 2312-80에서는 le 위치에만 있고 유니코드에서는 U+4E50에만 있으나, 乐의 독음이 lè(한국 한자음 '락'에 해당됨)일 때도 yuè(한국 한자음 '악'에 해당됨)일 때도 똑같은 코드의 똑같은 글자 乐가 전혀 문제없이 사용된다.
  • 일본어 입력기는 生きる(きる), 生む(む), 生地(じ), 生じる(しょうじる), 誕生(たんじょう), 生物(せいぶつ), 生意気(なまいき), 生える(える), 芽生える(めえる), 芝生(しば) 등에 코드까지 정확히 똑같은 글자(유니코드: U+751F, JIS X 0208: 32-24 (Shift_JIS: 0x90B6, EUC-JP: 0xC0B8))을 사용한다. 生는 일본의 기본 문자 코드 JIS X 0208에서는 せい 위치에만 있고 유니코드에서는 U+751F에만 있으나, 生의 독음이 무엇이건 간에 똑같은 코드의 똑같은 글자 生가 전혀 문제없이 사용된다.

이와 같이 한 글자의 여러 독음은 입력기 차원에서 해결하면 되는 문제이다. 즉 '다른 독음으로도 원하는 한자를 입력할 수 있도록 하기 위해서'는 한자를 문자 코드상으로 중복 배당할 이유가 전혀 되지 않는다.

보고서에서 공식적인 이유로 언급된 정렬 또한 한자가 거의 사장된 지금으로서는 의미 없는 얘기에 불과하다.

4. 유니코드에서의 처리

유니코드는 한자 하나당 한 코드를 부여하는 것이 원칙이나, KS 코드와의 호환을 위해 KS 코드의 중복 한자들 중 하나만을 통합 한자 영역(U+4E00~U+9FFF)에 넣고 나머지는 호환용 한자 영역(U+F900~U+FAFF)에 넣었다. 樂의 경우 '악'에 해당되는 것만 통합 한자에 들어갔고 나머지 셋은 호환용 한자에 들어갔다.

유니코드는 기존 문자 집합과의 왕복 변환(round trip)을 위해서만 호환용 한자의 사용을 허용하고 있고, 다른 용도로 사용하는 것은 권장하지 않고 있다. 따라서 나무위키에서 한자 문서를 작성할 때는 통합 한자만을 사용하는 것을 원칙으로 하고 있다. 즉 樂의 경우 樂(악, U+6A02)만을 사용하고 樂(낙, U+F914), 樂(락, U+F95C), 樂(요, U+F9BF)는 사용하지 않는다. 호환용 한자를 사용하면 괜히 불편만 초래하니, 웬만하면 통합 한자만을 쓰도록 하자. 참고로 Chrome이나 Safari, 미디어위키에서는 호환용 한자를 입력하면 아예 통합 한자로 자동으로 바뀌며, 호환용 한자를 그대로 입력할 수 없다. 이 문서를 크롬이나 사파리로 편집하거나, 이 문서의 내용을 복사해 미디어위키에 붙여 넣으면 호환용 한자가 모두 통합 한자로 자동으로 바뀌게 된다.

미디어위키에다가 호환용 한자를 집어넣고 미리 보기를 실행하면 자동으로 통합 한자로 바뀌므로, 호환용 한자 → 통합 한자 자동 변환을 원하는 사람들은 미디어위키에 변환할 문자열을 넣고 미리 보기를 한 뒤 그 결과물을 복사해서 쓰는 방법도 있다.

만약 한국어 입력기로 일본어나 중국어를 입력할 경우(물론 일본어나 중국어를 한국어 입력기로 입력하는 것 자체가 권장되지는 않는다), 호환용 한자를 쓰면 제대로 인식·출력되지 않을 수도 있으므로 통합 한자만을 사용하는 것이 바람직하다. 아래 리스트에서 '통합 한자' 줄에 있는 음가로 변환해야 한다. (예: 樂의 경우 '악'으로만 변환해야 하며, 年金의 경우 '년김'으로만 변환해야 함)

나무위키에서 호환용 한자를 검색했을 때 검색 결과에 이 문서와 의도적으로 호환용 한자를 쓴 문서 유니코드/F000~FFFF, 한자/KS X 1001, 한자/BMP, 알맞은 리다이렉트밖에 나오지 않는 것이 가장 이상적이다. 참고로 이 문서에서도 위에서 李와 樂을 언급하는 부분, 아래에서 林과 劉와 柳를 언급하는 부분, 아래의 중복 한자 목록 그 자체를 제외하고는 호환용 한자가 사용되지 않았다.

데이터 처리 시에 또한 OS나 에디터의 차이로 호환용 한자가 입력된 경우 다른 글자로 처리되는 문제가 있는데, 이를 해결하기 위해 많은 프로그래밍 라이브러리나 프레임워크 수준에서 지원을 해 주고 있다. 예를 들어 C#의 경우 Char나 String 타입에 정규화(Normalize)라는 함수를 통해 하나의 대표 코드를 알아내는 게 가능하다.

참고로 리그베다 위키 시절에는 호환용 한자를 문서 제목에 쓸 수 있었으나, 나무위키에서는 호환용 한자를 문서 제목에 사용할 수 없다. 문서 제목에 포함된 호환용 한자는 문서 편집 시에 저절로 통합 한자로 바뀐다. 다만 문서 내용에 포함된 호환용 한자는 (크롬이나 사파리 등 자체적으로 정규화를 실시하는 웹 브라우저를 사용하는 경우를 제외하고는) 그대로 유지된다.

그리고 중복 한자의 모습은 글꼴에 따라 완전히 같을 수도 있고 약간 다를 수도 있다. Source Han Sans(Noto Sans CJK)는 완전히 같은 모습을 보이고,[8], Microsoft Windows의 기본 한국어 글꼴 '돋움'은 약간 다른 모습을 보인다(참고).[9]

5. 다른 언어 문자 코드와의 호환 문제

다른 언어 문자 코드에는 기본적으로 KS 코드 유래의 호환용 한자가 존재하지 않으므로, 일본어·중국어 웹사이트에서 KS 코드 유래의 호환용 한자를 입력하면 인식이 안 되는 경우가 있다. 실제로 한국인이 일본어·중국어 웹사이트에서 자신의 한자 이름을 한국어 입력기로 입력하면 간혹 호환용 한자 때문에 인식이 안 되는 문제가 생긴다.
  • 실제 사례 1 – 일본어 웹사이트에서 林이 인식이 안 됨
  • 실제 사례 2 – 일본어 웹사이트에서 劉 또는 柳가 인식이 안 됨

사례 1은 林(림, U+6797)이 아니라 林(임, U+F9F4)으로 입력했기 때문이고, 사례 2는 劉(류, U+5289) 또는 柳(류, U+67F3) 대신 劉(유, U+F9C7) 또는 柳(유, U+F9C9)로 입력했기 때문이다. 실제로는 통합 한자 林(U+6797), 劉(U+5289), 柳(U+67F3)는 모두 기본 일본어 문자 코드(JIS X 0208)에 있기 때문에 일본어 환경에서 문제없이 처리된다.

그러므로 일본어·중국어 웹사이트에서 자신의 한자 이름을 입력해야 하는 상황이라면 호환용 한자가 입력되지 않았는지 확인하거나, 호환용 한자 입력 여부를 확인하기 어렵다면 Chrome, Safari, 미디어위키 등 호환용 한자를 통합 한자로 자동으로 바꿔 주는 환경을 이용하거나 아니면 아예 처음부터 자신의 한자 이름을 일본어 입력기나 중국어 입력기로 입력하는 게 좋다.

KS 코드 제정 당시의 정신 나간 결정 때문에 사용자 입장에서 불필요하게 신경 써야 할 것만 하나 늘어난 셈이다.

6. 중복 한자 목록

모두 268자로, '두음'이 203자(75.7%), '일반'이 65자(24.3%)이다.

6.1. 두 번 중복(일반)

한국어 독음이 원래 두 개인 한자들이다. 두음 법칙에 의한 중복과는 달리 일정한 규칙이 없기 때문에 통합 한자로 입력하려면 그냥 외우는 수밖에 없다. 串, 金, 不의 경우 흔히 본음으로 알고 있는 관, 금, 불과 달리 곶, 김, 부로 입력해야 통합 한자가 나온다.

왠지는 알 수 없지만, 한컴오피스 한글의 경우 2007까지만 해도 串, 金, 復, 不의 매핑이 반대로 되어 있었다.[10] 유니코드 표준 매핑은 아래 표에 나온 그대로이다.
통합 한자 호환 한자 종류
8CC8F903 일반
964DFA09 일반
898BFA0A 일반
66F4F901 일반
5951F909 일반
4E32F905 일반
5ED3FA0B 일반
53E5F906 일반
8C48F900 일반
91D1F90A 일반
62CFF95B 일반
8AFEF95D 일반
5948F90C 일반
6012F960 일반
8336F9FE 일반
4E39F95E 일반
7CD6FA03[11] 일반
5B85FA04 일반
5EA6FA01 일반
8B80F95A 일반
6D1EFA05 일반
78FBF964 일반
5FA9F966 일반
8F3BFA07 일반
4E0DF967 일반
5317F963 일반
6BBAF970 일반
72C0F9FA 일반
585EF96C 일반
7D22F96A 일반
7701F96D 일반
6578F969 일반
62FEF973 일반
8B58F9FC 일반
4EC0F9FD 일반
60E1F9B9 일반
82E5F974 일반
6613F9E0 일반
8449F96E 일반
962EF9C6 일반
7570F962 일반
54BDF99E 일반
523A 刺 F9FF 일반
7099F9FB 일반
5207FA00 일반
8FB0F971 일반
8ECAF902 일반
53C3F96B 일반
62D3FA02 일반
6C88F972 일반
便 4FBFF965 일반
66B4FA06 일반
6CCCF968 일반
884CFA08 일반
7469F9AE 일반
6ED1F904 일반
6688F9C5 일반

6.2. 두 번 중복(두음)

두음 법칙으로 인해 중복된 한자들이다. 이 경우 통합 한자로 입력하려면 두음 법칙이 적용되지 않은 본래의 독음으로 변환하면 된다. 예외로는 涅(개흙 녈)이 있는데, 이 글자는 중복 한자가 아니다(원래 음인 '녈'로는 아예 한자 변환이 되지 않으며, '열'로 변환하면 통합 한자가 나온다).

중복 한자 중 拏(붙잡을 나), 諾(허락할 낙), 怒(성낼 노), 異(다를 이)는 두음 법칙이 아닌 활음조 현상에 의한 중복 한자이므로 주의. 바로 위 문단에 있다. 이들은 원래 음이 '나', '낙', '노', '이'이며, '라', '락', '로', '리' 쪽이 바뀐 음이기 때문에 '나', '낙', '노', '이'로 변환해야 통합 한자가 나온다. 아래 '세 번 중복' 문단에 있는 寧(편안할 녕)도 원래 음은 '령'이 아닌 '녕'이므로 통합 한자 입력을 원한다면 주의할 것.
통합 한자 호환 한자 종류
5973F981 두음
5E74F98E 두음
649AF991 두음
79CAF995 두음
5FF5F9A3 두음
637BF9A4 두음
尿 5C3FF9BD 두음
677BF9C8 두음
7D10F9CF 두음
6CE5F9E3 두음
533FF9EB 두음
6EBAF9EC 두음
5587F90B 두음
61F6F90D 두음
7669F90E 두음
7F85F90F 두음
863FF910 두음
87BAF911 두음
88F8F912 두음
908FF913 두음
6D1BF915 두음
70D9F916 두음
73DEF917 두음
843DF918 두음
916AF919 두음
99F1F91A 두음
4E82F91B 두음
5375F91C 두음
6B04F91D 두음
721BF91E 두음
862DF91F 두음
9E1EF920 두음
5D50F921 두음
6FEBF922 두음
85CDF923 두음
8964F924 두음
62C9F925 두음
81D8F926 두음
881FF927 두음
5ECAF928 두음
6717F929 두음
6D6AF92A 두음
72FCF92B 두음
90DEF92C[12] 두음
4F86F92D 두음
51B7F92E 두음
63A0F975 두음
7565F976 두음
4EAEF977 두음
5169F978 두음
51C9F979 두음
6881F97A 두음
7CE7F97B 두음
826FF97C 두음
8AD2F97D 두음
91CFF97E 두음
52F5 勵 F97F 두음
5442F980 두음
5EECF982 두음
65C5F983 두음
6FFEF984 두음
792AF985 두음
95ADF986 두음
9A6AF987 두음
9E97F988 두음
9ECEF989 두음
529BF98A 두음
66C6F98B 두음
6B77F98C 두음
8F62F98D 두음
6190F98F 두음
6200F990 두음
6F23F992 두음
7149F993 두음
7489F994 두음
7DF4F996 두음
806FF997 두음
84EEF999 두음
8F26F998 두음
9023F99A 두음
934AF99B 두음
5217F99C 두음
52A3F99D 두음
70C8F99F 두음
88C2F9A0 두음
5EC9F9A2 두음
6BAEF9A5 두음
7C3EF9A6 두음
7375F9A7 두음
4EE4F9A8 두음
56F9F9A9 두음
5DBAF9AB 두음
601CF9AC 두음
73B2F9AD 두음
7F9AF9AF 두음
8046F9B0 두음
9234F9B1 두음
96F6F9B2 두음
9748F9B3 두음
9818F9B4 두음
4F8BF9B5 두음
79AEF9B6 두음
91B4F9B7 두음
96B7F9B8[13] 두음
52DEF92F 두음
64C4F930 두음
6AD3F931 두음
7210F932 두음
76E7F933 두음
8001F934 두음
8606F935 두음
865CF936 두음
8DEFF937 두음
9732F938 두음
9B6FF939 두음
9DFAF93A 두음
788CF93B 두음
祿 797FF93C 두음
7DA0F93D 두음
83C9F93E 두음
9304 錄 F93F 두음
鹿 9E7FF940 두음
8AD6F941 두음
58DFF942 두음
5F04F943 두음
7C60F944 두음
807EF945 두음
7262F946 두음
78CAF947 두음
8CC2F948 두음
96F7F949 두음
4E86F9BA 두음
50DAF9BB 두음
5BEEF9BC 두음
6599F9BE 두음
71CEF9C0 두음
7642F9C1 두음
84FCF9C2 두음
907CF9C3 두음
9F8DF9C4 두음
58D8F94A 두음
5C62F94B 두음
6A13F94C 두음
6DDAF94D 두음
6F0FF94E 두음
7D2FF94F 두음
7E37F950 두음
964BF951 두음
5289F9C7 두음
67F3F9C9 두음
6D41F9CA 두음
6E9CF9CB 두음
7409F9CC 두음
7559F9CD 두음
786BF9CE 두음
985EF9D0 두음
516DF9D1 두음
622EF9D2 두음
9678F9D3 두음
502BF9D4 두음
5D19F9D5 두음
6DEAF9D6 두음
8F2AF9D7 두음
5F8BF9D8 두음
6144F9D9 두음
6817F9DA 두음
9686F9DC 두음
52D2F952 두음
808BF953 두음
51DCF954 두음
51CCF955 두음
7A1CF956 두음
7DBEF957 두음
83F1F958 두음
9675F959 두음
5229F9DD 두음
540FF9DE 두음
5C65F9DF 두음
674EF9E1 두음
68A8F9E2 두음
7406F9E4 두음
75E2F9E5 두음
7F79F9E6 두음
88CFF9E7 두음
88E1F9E8 두음
91CCF9E9 두음
96E2F9EA 두음
541DF9ED 두음
71D0F9EE 두음
7498F9EF 두음
85FAF9F0 두음
96A3F9F1 두음
9C57F9F2 두음
9E9FF9F3 두음
6797F9F4 두음
6DCBF9F5 두음
81E8F9F6 두음
7ACBF9F7 두음
7B20F9F8 두음
7C92F9F9 두음

6.3. 세 번 중복

통합 한자 호환 한자 1 호환 한자 2 종류 1 종류 2
9F9CF907F908 일반 일반
5BE7F95FF9AA 일반 두음
8AAA[14] F96FF9A1 일반 일반
7387F961F9DB 일반 두음

6.4. 네 번 중복

통합 한자 호환 한자 1 호환 한자 2 호환 한자 3 종류 1 종류 2 종류 3
6A02F914F95C 樂 F9BF 두음 일반 일반

7. 관련 문서


[1] 일단 음독 외에 훈독이 존재하고, 음독과 훈독도 여러 종류가 있다.[2] 훈독이 많기로 악명 높은 한자이다.[3] 유니코드의 A(U+0041, 라틴 문자 대문자 에이), Α(U+0391, 그리스 문자 대문자 알파), А(U+0410, 키릴 문자 대문자 아)와 같은 경우는 속하는 문자 체계가 다르고 개별 문자 자체가 다른 문자이기 때문에 별도의 글자로 배당된 것이고(가짜동족어와 비슷하다고 보면 된다), 같은 문자 체계의 같은 문자가 중복 배당된 것이 아니다. 한글 자모 ㅁ(미음)과 한자 口(입 구)가 다른 문자이고 둘에 별도의 코드가 주어진 것과 같다.[4] 검색 엔진이나 소프트웨어, 시스템에 따라 이 중복 한자들을 똑같은 글자로 취급해 주기도 하고, 그냥 다른 글자들로 취급하기도 한다. 물론 똑같은 글자로 취급하도록 만들려면 검색 엔진이나 소프트웨어, 시스템 차원에서 별도의 처리가 필요하다.[5] 활음조 현상에 더 많은 예시(전체 다는 아님)[6] 한컴오피스 한글이나 Microsoft Word와 같은 워드프로세서 등에서는 '한글→한자' 변환은 물론 '한자→한글' 변환도 가능하다.[7] 실제로 한컴오피스 한글에서도 여러 독음을 후보로 표기하는 방식을 사용하고 있다.[8] Source Han Sans는 자형(glyph)은 하나만 마련해 놓고 그 자형 하나가 여러 유니코드 코드 포인트에 사용되도록 만들었다. 그러니 모습이 같을 수밖에 없다.[9] MS의 기본 한국어 글꼴들은 중복 한자를 하나하나 다 그렸기 때문으로 보인다.[10] 한/글 2010에서는 저 네 글자의 매핑이 유니코드 표준 매핑대로 고쳐졌다. 그래서 한/글 2010부터는 저 네 글자를 한글로 바꾸고자 할 경우 어떻게 바꿀지를 묻는다. 한/글 2007 이하 버전으로 작성된 글과의 호환성 또는 한/글 외의 환경에서 작성된 글과의 호환성을 위해서인 듯하다.[11] 정작 한국어문회에선 '탕'이라는 음을 인정하지 않는다. 정확히는 한때 '사탕 탕'이라는 훈음을 반영했으나 언젠가부터 '사탕 탕'은 삭제되고 '엿 당'만 남게 되었다.[12] 유니코드에는 이 U+F92C 郎의 매핑이 올바른 U+90DE 郞가 아니라 U+90CE 郎로 잘못되어 있다. 이 매핑은 고칠 수 없기 때문에, U+FA2E 郞에 이 글자가 올바른 매핑(U+90DE 郞)으로 다시 배당되었다.[13] 유니코드에는 이 U+F9B8 隸의 매핑이 올바른 U+96B7 隷이 아니라 U+96B8 隸로 잘못되어 있다. 이 매핑은 고칠 수 없기 때문에, U+FA2F 隷에 이 글자가 올바른 매핑(U+96B7 隷)으로 다시 배당되었다.[14] 신자체를 위한 説(U+8AAC)이 따로 배당되어 있는데, 稅(U+7A05)도 마찬가지로 신자체를 위한 税(U+7A0E)가 따로 배당되어 있다. 그런데 사실 같은 글자들이다. 이보다 훨씬 더 엉망(?)인 益, 溢이 하나의 코드를 쓰는데도 말이다. 특히 益은 이들과 거꾸로 되어 있다. 통합 한자인 益(U+76CA)이 신자체로 활용되는 반면 호환용 한자에 있는 益(U+FA17)은 구자체로 되어 있다.

분류