코드 매핑(Mapping)의 원리
한자를 빠르고 쉽게 입력하기 위해 코드를 이용합니다.
그런데, 한자를 보면 코드가 떠올라야, 바로 키보드를 두드릴 수 있습니다.
그렇다면, 코드를 외우고 있어야 한다는 말인데. . . 185개의 CAW알파벳을 어떻게 외울수 있을까요?
먼저, 한자에 어떻게 코드가 할당이 되었는지 이해해봅시다.
약 11000자의 한자를 더이상 쪼갤 수 없을 때까지 쪼개고, 그 쪼개진 문자들(거의 40000자에 달함) 중에서, 하나의 뜻을 가진 한자이면서 또 여럿이 모여 11000자의 한자를 이루어 내는 조각문자들을 찾았습니다. 그리하여, 185개의 그 문자들을 CAW ALPHABET이라고 부르기로 했습니다.
그리고, 키보드 자판에 CAW알파벳을 각각 배정해서 쉽게 입력할 수 있도록, 영어 알파벳을 코드로 사용하기로 했습니다. 그리하여 각 CAW알파벳 한자의 발음(병음)에 입각해, 코드의 첫째 문자를 결정했습니다.
개발자 직강
한글 자모의 문자가 많지 않다고 볼 수 있지만, 이들 문자들을 자판에서 익히는 데 많은 노력을 기울인 경험이 있을 것입니다. 코우 알파벳 184자를 컴퓨터 자판에 적용하는 문제도 쉽지 않습니다. 이 문제에 대한 해결책이 5개 모음군( A, E, I, O, U) 원칙입니다.
모음군이란, 5개 모음 각각의 컴퓨터 자판 위치에서, 같은 라인에 있는 문자들의 모음이라고 보면 쉽습니다.
가. 빈도수에 따른 코드 배정
우선 먼저, CAW 알파벳 184개의 문자들의 빈도수를 계산해서 가장 자주 쓰이는 문자 군을 에이스 코드에 적용시킵니다. (빈도수의 의미는 40000자에 달하는 한자를 더 이상 쪼갤 수 없는 상태로 분해했을 때, 한자 안에 가장 많이 쓰인 빈도수를 말합니다.)
예를 들면 칼 도(刀)의 경우 중국 병음이 [dao]이고 d로 시작되는 알파벳 중에 빈도수가 가장 높으므로 dd란 코드를 가지게 됩니다.
두 번째는 역시 원어 발음에 기초하여, 5개 모음인 A , E , I , O , U 가 적용된 코드입니다. 이것 또한 빈도수가 가장 높은 문자에 적용되는 매핑 방식입니다.
예를 들면, 여덟 팔 八의 경우 중국 병음이 ba이고, 빈도수가 가장 높으므로 그대로 ba란 코드를 적용시킵니다. 한국어를 기준으로 하면 pa라고 할 수 있지만, 이렇게 할 경우 국제적으로 매우 혼란스럽게 되어, ba라고 하게 되었습니다.
나. [ a , e , i , o , u ] 5개 모음군 코드 매핑
八자에 코드 ba가 적용되었으므로 bai란 음을 가진 白자는 두 번째 a음에 해당하는 s를 적용시켜 bs가 되는 형식입니다. 알파벳 문자의 코드 매핑 원칙은 동양 고전의 음양5행에 근거하고 있습니다. ba란 코드에서 보았듯이 첫 번째 코드 b는 자음, 두 번째 코드 a는 모음에 해당됩니다. 두 번째 코드가 부족할 경우 이 모음군의 원칙에 따라 a의 자리에 다른 모음군 코드가 배정됩니다. 大는 중국병음에 따라 da란 코드가 적용되고 歹[dai]에는 ds란 코드가 배정됩니다. 따라서 184자의 병음을 알게 되면, 정확한 코드를 알지 못해도 유추해서 찾아갈 수 있으므로, 하루 내로 익힐 수 있게 됩니다.
1) A행 모음군
A 모음에 해당하는 두 번째 코드의 모음군은 키보드 상 a와 인접한 5문자 a , s , d , f , g 입니다.
干은 ga란 코드를 가지고 高 [gao]는 두 번째 코드 gs를 가지게 됩니다.
2) E행 모음군
모음 e와 인접한 e , t , r , w , q 가 e 모음 군에 해당됩니다.
屮[che]는 ct코드를 가집니다. 발음 코드에 의해서 車[che]가 ce란 코드를 가지기 때문입니다.
3) I행 모음군
키보드 상에서 i와 인접한 h, I , j , k , l 문자들이 i 대용으로 사용되는 모음군입니다.
빈도수에 따라 厶[si]는 si 코드를 가지고 豕[shi]는 sh 코드를 가지게 됩니다.
4) O행 모음군
o , p , b , n , m 이 O행 모음군에 해당합니다.
工[gong]은 빈도수에 근거해서 go 코드를 가지고 弓[gong]은 두 번째 O음인 p가 적용되어 gp란 코드가 됩니다.
5) U행 모음군
u , x , y , z , c 가 U행 모음군입니다.
辶[chuo]는 cu 코드를 川[chun]은 cy 코드, 寸[cun]은 cz 코드를 가집니다.
에이스 코드 (쌍자음 코드)와 발음 코드( a, e, i, o, u 모음군 코드)가 50% 이상을 차지하고 있어 이들은 몇시간 내로 완전히 익힐 수 있고, 나머지 문자들도 위의 코드 원칙에 근거해서 어디 쯤 놓여 있는 지 짐작할 수가 있습니다.