제로 에너지의 글로벌 리더 (주)제로엔

제품소개

고객문의친절히 상담해 드립니다

고객센터

010-4682-3212FAX : 050-4276-6768cawplus@naver.com

상담시간안내오전 9시~오후 6시 까지

제품소개코드 매핑의 원리

코드 매핑의 원리

스마트폰 한국어 중국어 입력기 


이 제품은 안드로이드 스마트폰 CAW 중국어/한국어 IME 입니다. 
한자의 표현은 KSC 5601 4888자, 중국 상용자 2500자, 차상용자 1000자, 일본 IICore 9710자를 표현할 수 있습니다. 
한글은 KSC 5601문자를 표현가능합니다. 따라서 사용되지 않는 문자 중에 표현되지 않는 문자가 있지만 사용하는데는 큰 불편이 없고 곧 데이터를 보충할 예정입니다. 

특징
1) 메모장에 표헌되는 글자의 크기를 조정할 수 있다.
2) 스마트폰에 내장되어 있는 시스템 IME를 사용할 수 있습니다. 
- 일부 시스템 IME (Galaxy S8의 천지인 자판)인 경우, 줄바꿈에 문제가 있습니다. 삼성전자에서 수정 배포해야 할 사안입니다. 알키보드 등 다른 가상 키보드를 사용하면 문제가 없습니다.
3) 중국어-한국어 동시 표현
본 제품의 최종 목표는 중국어-일본어-한국어-미국어를 표현하는 것인데, 이중에서 가장 난이도가 높은 중국어-한국어를 먼저 내놓게 되었습니다. 한국어는 첨부된 설명에서 볼 수 있는 바와 같이 최고의 성능을 가지고 있습니다.

제품 테스트는 Galaxy S8를 사용하였습니다.


코드 매핑(Mapping)의 원리

한자를 빠르고 쉽게 입력하기 위해 코드를 이용합니다.
그런데, 한자를 보면 코드가 떠올라야, 바로 키보드를 두드릴 수 있습니다.
그렇다면, 코드를 외우고 있어야 한다는 말인데. . . 185개의 CAW알파벳을 어떻게 외울수 있을까요?

먼저, 한자에 어떻게 코드가 할당이 되었는지 이해해봅시다.

약 11000자의 한자를 더이상 쪼갤 수 없을 때까지 쪼개고, 그 쪼개진 문자들(거의 40000자에 달함) 중에서, 하나의 뜻을 가진 한자이면서 또 여럿이 모여 11000자의 한자를 이루어 내는 조각문자들을 찾았습니다. 그리하여, 185개의 그 문자들을 CAW ALPHABET이라고 부르기로 했습니다.

그리고, 키보드 자판에 CAW알파벳을 각각 배정해서 쉽게 입력할 수 있도록, 영어 알파벳을 코드로 사용하기로 했습니다. 그리하여 각 CAW알파벳 한자의 발음(병음)에 입각해, 코드의 첫째 문자를 결정했습니다.

개발자 직강

한글 자모의 문자가 많지 않다고 볼 수 있지만, 이들 문자들을 자판에서 익히는 데 많은 노력을 기울인 경험이 있을 것입니다. 코우 알파벳 184자를 컴퓨터 자판에 적용하는 문제도 쉽지 않습니다. 이 문제에 대한 해결책이 5개 모음군( A, E, I, O, U) 원칙입니다.

모음군이란, 5개 모음 각각의 컴퓨터 자판 위치에서, 같은 라인에 있는 문자들의 모음이라고 보면 쉽습니다.

가. 빈도수에 따른 코드 배정

우선 먼저, CAW 알파벳 184개의 문자들의 빈도수를 계산해서 가장 자주 쓰이는 문자 군을 에이스 코드에 적용시킵니다. (빈도수의 의미는 40000자에 달하는 한자를 더 이상 쪼갤 수 없는 상태로 분해했을 때, 한자 안에 가장 많이 쓰인 빈도수를 말합니다.)
예를 들면 칼 도(刀)의 경우 중국 병음이 [dao]이고 d로 시작되는 알파벳 중에 빈도수가 가장 높으므로 dd란 코드를 가지게 됩니다.

두 번째는 역시 원어 발음에 기초하여, 5개 모음인 A , E , I , O , U 가 적용된 코드입니다. 이것 또한 빈도수가 가장 높은 문자에 적용되는 매핑 방식입니다.
예를 들면, 여덟 팔 八의 경우 중국 병음이 ba이고, 빈도수가 가장 높으므로 그대로 ba란 코드를 적용시킵니다. 한국어를 기준으로 하면 pa라고 할 수 있지만, 이렇게 할 경우 국제적으로 매우 혼란스럽게 되어, ba라고 하게 되었습니다.

나. [ a , e , i , o , u ] 5개 모음군 코드 매핑

八자에 코드 ba가 적용되었으므로 bai란 음을 가진 白자는 두 번째 a음에 해당하는 s를 적용시켜 bs가 되는 형식입니다. 알파벳 문자의 코드 매핑 원칙은 동양 고전의 음양5행에 근거하고 있습니다. ba란 코드에서 보았듯이 첫 번째 코드 b는 자음, 두 번째 코드 a는 모음에 해당됩니다. 두 번째 코드가 부족할 경우 이 모음군의 원칙에 따라 a의 자리에 다른 모음군 코드가 배정됩니다. 大는 중국병음에 따라 da란 코드가 적용되고 歹[dai]에는 ds란 코드가 배정됩니다. 따라서 184자의 병음을 알게 되면, 정확한 코드를 알지 못해도 유추해서 찾아갈 수 있으므로, 하루 내로 익힐 수 있게 됩니다.

1) A행 모음군

A 모음에 해당하는 두 번째 코드의 모음군은 키보드 상 a와 인접한 5문자 a , s , d , f , g 입니다.

干은 ga란 코드를 가지고 高 [gao]는 두 번째 코드 gs를 가지게 됩니다.

2) E행 모음군

모음 e와 인접한 e , t , r , w , q 가 e 모음 군에 해당됩니다.

屮[che]는 ct코드를 가집니다. 발음 코드에 의해서 車[che]가 ce란 코드를 가지기 때문입니다.

3) I행 모음군

키보드 상에서 i와 인접한 h, I , j , k , l 문자들이 i 대용으로 사용되는 모음군입니다.

빈도수에 따라 厶[si]는 si 코드를 가지고 豕[shi]는 sh 코드를 가지게 됩니다.

4) O행 모음군

o , p , b , n , m 이 O행 모음군에 해당합니다.

工[gong]은 빈도수에 근거해서 go 코드를 가지고 弓[gong]은 두 번째 O음인 p가 적용되어 gp란 코드가 됩니다.

5) U행 모음군

u , x , y , z , c 가 U행 모음군입니다.

辶[chuo]는 cu 코드를 川[chun]은 cy 코드, 寸[cun]은 cz 코드를 가집니다.

에이스 코드 (쌍자음 코드)와 발음 코드( a, e, i, o, u 모음군 코드)가 50% 이상을 차지하고 있어 이들은 몇시간 내로 완전히 익힐 수 있고, 나머지 문자들도 위의 코드 원칙에 근거해서 어디 쯤 놓여 있는 지 짐작할 수가 있습니다.

무료홈페이지제작 씨피이코리아 대한신문 중소기업 소상인을 위한 한국중소기업협의회 농어민을 위한 나눔샵