本發(fā)明涉及漢字編碼領(lǐng)域,特別是順應(yīng)漢字的形與音拆字取碼的反切碼漢字編碼法。
在計(jì)算機(jī)漢字輸入方面,目前廣泛應(yīng)用的“五筆字形”,其在使用過(guò)程中有以下缺陷一是不按漢字構(gòu)成拆分,不符合傳統(tǒng)拆字習(xí)慣,有些拆分不符合筆順規(guī)范。如“爸”,本應(yīng)一分為二,拆為“父巴”,卻一分為三,拆為“八乂巴”?!案铩弊直緫?yīng)一分為三拆為“廿口十”,卻一分為二拆為“廿”加一個(gè)自造字根(革字的下部)?!搬搿北臼且粋鹘y(tǒng)部首,卻人為地取前二筆為一自造字根。“回”本應(yīng)先寫“冂”,次寫“口”,最后封筆寫“一”,卻拆為“口口”,在語(yǔ)文教學(xué)中,這叫倒筆。這種拆分既違背傳統(tǒng)拆字習(xí)慣,也不利于語(yǔ)文教學(xué)和維護(hù)祖國(guó)語(yǔ)言文字的純潔;二是使用鍵盤輸入字根時(shí),既不管字根本來(lái)的讀音,又人為地為鍵盤字母另行定義,如將“王五一”三個(gè)不同音的字均賦予G鍵名,致使原本互不一致的大量字根(約193個(gè))讀名與鍵盤字母名稱之間求同譯轉(zhuǎn),增加了記憶的難度;三是編碼規(guī)則較繁,不易掌握,難學(xué)易忘。
另外有一類和英文鍵名掛鉤的編碼,將漢字部件的形態(tài)與英文字母形態(tài)求同,如“命”,取碼為“AOP”。這種編碼也與人們認(rèn)字習(xí)慣相背離。
最近面世的一碼輸入法,是一種順應(yīng)漢字的形與音拆字取碼的漢字編碼,如“香”讀xiāng,拆為XHR(xiāng禾日),但一般人對(duì)不知讀音的字(如“緙”)無(wú)法定碼。
本發(fā)明的目的之一是克服上述缺陷,為廣泛的人群提供一種符合人們認(rèn)字習(xí)慣、規(guī)則簡(jiǎn)單、操作方便、易學(xué)易記的漢字輸入法。
在辭書檢索方面,現(xiàn)在的辭書,大多是按讀音歸類排序,按部首檢索。其弊端是按讀音歸類,造成了多音字的肢解,更主要的是不知讀音的字不能查找。按部首檢索,查一個(gè)字得先判斷屬哪一部(有些字判斷部屬較難),再數(shù)部首筆畫數(shù)找到部首,再數(shù)字的筆畫數(shù)找到那個(gè)字,然后才是依據(jù)頁(yè)碼翻頁(yè)。
一碼輸入法的漢字編碼,由于憑借漢字讀音取碼,不能用于辭書檢索。
本發(fā)明的目的之二是用本編碼作辭書檢索,直接翻頁(yè),一步到位,可以避免現(xiàn)在的辭書在翻頁(yè)前通常的繁瑣查找過(guò)程。
本發(fā)明的目的是按下述技術(shù)方案實(shí)現(xiàn)的順形拆分;順音取碼;字、詞編碼長(zhǎng)度不大于四碼,不足四碼者,用二次分解法和反切法截取識(shí)別碼補(bǔ)位以分離同碼字。
本發(fā)明和現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn)一是順應(yīng)漢字構(gòu)成拆分漢字,符合傳統(tǒng)拆字習(xí)慣,適應(yīng)語(yǔ)文教學(xué),有利于祖國(guó)語(yǔ)言文字的純潔。
二是按漢字部件讀音取碼,利用計(jì)算機(jī)鍵盤英文字母鍵位作漢語(yǔ)拼音字母鍵位,不人為地為鍵盤字母另行定義,使文字輸入工作操作簡(jiǎn)易,避免了原本互不一致的大量字根讀名與鍵盤字母名稱之間求同譯轉(zhuǎn),沒有記憶的負(fù)擔(dān)。
三是用獨(dú)創(chuàng)的二次分解法、反切法拆分取碼,使規(guī)則簡(jiǎn)單,易學(xué)易記。
四是本編碼用于辭書檢索,漢字查找可以直接翻頁(yè),一步到位。
下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明本發(fā)明是一種順應(yīng)漢字的形與音拆分取碼的漢字編碼法,包括順形拆分;順音定碼;字、詞編碼長(zhǎng)度不大于四碼,不足四碼者,用二次分解法和反切法截取識(shí)別碼補(bǔ)位以分離同碼字。
上述二次分解法是先作第一級(jí)分解,將兩件字與三件字分解成部件,或?qū)勺衷~、三字詞詞條分解成單字,取主碼后,再作第二級(jí)分解,將部件或詞條里的單字拆分以便截取識(shí)別碼。
兩件字以偏旁部件或筆畫部件為前件的兩件字,先作第一級(jí)分解,將字分解成兩個(gè)部件取主碼后,再作第二級(jí)分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識(shí)別碼;以成字部件為前件的兩件字,先作第一級(jí)分解,將漢字分解出兩個(gè)部件取主碼后,再作第二級(jí)分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識(shí)別碼。
三件字先作第一級(jí)分解,將字分解成三個(gè)部件取主碼后,再作第二級(jí)分解,將第三件拆分,取第三件之末件作為識(shí)別碼。
兩字詞先將詞條作第一級(jí)分解,按兩字讀音的音首第一個(gè)字母定主碼,然后再作第二級(jí)分解,將兩字切分,用兩字前后反切法補(bǔ)上識(shí)別碼。
三字詞先將詞條作第一級(jí)分解,按三字讀音的音首第一個(gè)字母定主碼,然后再作第二級(jí)分解,將第三字切分取最后一件定為識(shí)別碼。
上述反切法是一種對(duì)兩件字或兩字詞切分反取的方法。
前件為偏旁部件或筆畫部件的兩件字,先作第一級(jí)分解,將字分解成兩個(gè)部件取主碼后,再作第二級(jí)分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識(shí)別碼;前件為成字部件的兩件字,先作第一級(jí)分解,將字分解出兩個(gè)部件取主碼后,再作第二級(jí)分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識(shí)別碼,兩字詞第一次按詞條兩個(gè)字的讀音取主碼后,再將兩字分別作第二次拆分,然后用前字取首、后字取尾的兩字反切法截取識(shí)別碼。
實(shí)施例一.順形拆分1.按漢字構(gòu)成拆分漢字由三種部件構(gòu)成現(xiàn)成漢字;偏旁部首;基本筆畫。本方案基本順應(yīng)漢字構(gòu)成拆分。頂,形聲字,從頁(yè)丁聲,本方案拆為?!№?yè)’(兩個(gè)成字部件)。信,會(huì)意字,從人從言。本方案拆為‘亻言’(一個(gè)偏旁部件,一個(gè)成字部件)。人,象形字,象側(cè)面站立的人形,象人的手臂與腿,本方案拆為‘丿ㄟ’(兩個(gè)筆畫部件)。
2.按漢字書寫筆順拆分。如“式”字,不拆為“弋工”二字,應(yīng)按書寫順序拆為“一工 ”;“脊”字,起筆應(yīng)按國(guó)家規(guī)定的筆順規(guī)范先寫“人”字的兩邊,拆為 人月”?!俺蟆?,拆為“刀二”,不拆為 ”。
3.隨字取形部件取形以印刷體規(guī)范漢字為準(zhǔn)。如“周”字,是“冂土口”,而不是“冂吉”。“或”字第五畫是挑,不是橫。“舍”,是“人干口”,而不是“人舌”。
有的筆畫在不同字里會(huì)發(fā)生不同變化,則根據(jù)不同變化隨字取形。如“乂”(yi),在“父”字里“乂”拆為“丿ㄟ”,而在“風(fēng)”字里則應(yīng)取為“丿丶”。
本編碼視傳統(tǒng)的變形體為相似形,并約定一些形體為相似形。如“看”字,“丿”起,起始件為“手”,應(yīng)拆分為“手目”?!鞍荨弊?,應(yīng)拆分為“手三十”。 是“卜”的相似形。歪尾 等同“羊”。 承襲辭書傳統(tǒng),視作“小”的同一部首。將“親殺茶”等字的末件視作“木”;將“木”字的后三筆約定為“小”。
以上詳見附錄二、三的有關(guān)相似形的說(shuō)明。附錄中未列又不屬基本保持原貌的傳統(tǒng)變形體者,均不作相似形處理。如“斤”字,最后一筆無(wú)鉤,是“丿丿一丨”,不是“丿丿丁”?!鞍睢?,應(yīng)拆分為“三丿阝”,而不是“豐”和“阝”;“壽”字則是“三丿寸”,不是“豐寸”?!芭小眲t拆為“半”和“刂”。
4.取大不取小部件容量取大“三”,應(yīng)拆分為“一二”兩件,不拆分為“一一一”三件。“鴻”,拆為“江鳥”;不拆作“氵工鳥”三個(gè)部件。“典”,拆為“冂共”;不拆作‘冂廿一八’四件。
部件級(jí)別取大漢字由三種部件構(gòu)成現(xiàn)成漢字;偏旁部首;基本筆畫。依次排比級(jí)別,成字部件最大,偏旁部件次之,再次是筆畫部件。夂,拆取為“丿又”,不取為“クㄟ”。
5.中分取整如“巫”,拆為“一丨從一”;“坐”,拆為“從土”;“乖”,拆為“千北”“小”字的兩邊,視作“八”字被中分,“小”拆作 八”。取整時(shí)應(yīng)注意筆形結(jié)構(gòu),如“乘”字腰中的兩邊合起來(lái)是一個(gè)“北”字,而收尾的緊密靠連的“丿ㄟ”兩筆不同于兩筆離散而有間隔的“八”,故“乘”字應(yīng)拆作“乖丿ㄟ”,不是“乖八”。
6.上下結(jié)構(gòu)靠上不靠下
“克”字中的“口”應(yīng)上靠,拆為“古兒”,不拆成“十兄”;“天”字,拆為“二人”,不拆為“一大”。
7.左右結(jié)構(gòu)靠后不靠前“拆”,拆為“扌斥”,不拆為“折丶”;“樹”拆為“木對(duì)”,不拆為“權(quán)寸”?!昂辈馂椤般吆保徊馂椤肮?、月”?!氨颉辈馂椤澳尽⑸肌?,不拆為“林、彡”。
8.取常不取偏構(gòu)字部件取簡(jiǎn)體字、正體字,不取繁體字、異體字。繁體部件字、異體部件字應(yīng)拆零分解。如“覆”字的下部“復(fù)”為“復(fù)”的繁體字,故“復(fù)”應(yīng)拆零成“彳、復(fù)”兩個(gè)部件取碼;“蔥”,取“卄匆心”,不取“卄忽”,“忽”是“匆”的異體字。
構(gòu)字部件不取古字如“番”,取“丿米田”,不取“采田”?!安伞?biàn)為“辨”的古字,現(xiàn)在不用?!搬尅保∽鳌柏子重?。
成字部件取現(xiàn)代漢語(yǔ)通常用字(范圍基本以GB2312的6763個(gè)漢字為準(zhǔn)),不取生僻字。生僻字拆零分解,如“菌”字,拆為“艸冂禾一”,不拆為“艸囷”?!皣铩?qūn)是生僻字,古指谷倉(cāng)。“搋”,拆為“扌丿丿虎”,不拆為“扌虒”?!疤尅?讀sī)字是生僻字。二.順音定碼按所取部件的普通話的讀音,取音首第一個(gè)字母為該部件的代碼,多音的表音部件則隨字定音。扁,常讀biǎn,又讀piān(扁舟),在‘蝙’字里取biǎn,代碼為‘B’;在‘篇’字里則取piān,代碼為‘P’。
“句”,一讀jù,一讀gōu(人名句踐讀gōu),‘夠’取碼為‘GD’(句多),‘佝僂’的‘佝’(gōu)取碼為‘RG’(亻句)。
對(duì)于全部讀音均與本字讀音不一致或無(wú)關(guān)聯(lián)的多音偏旁部件,采用常讀音定碼。‘耀’(yào)字的右件‘翟’,現(xiàn)在用于姓氏讀zhái,為常讀音,古代指稱長(zhǎng)尾野雞讀dí。在現(xiàn)代語(yǔ)音里,此兩讀的聲、韻均與‘耀’(yào)的讀音無(wú)關(guān)。則‘耀’字取碼為‘GZ’(光翟)。番,常讀音為‘fān’,另在地名‘番禺’里讀‘pān’。在‘播’字里‘番’作部件取常讀音‘fǎn’定碼。
有些字其部件為多音件,本字也為多音字,如‘櫟’,稱樹讀lì,地名櫟陽(yáng)讀yuè,則‘櫟’既取為‘ML’,也取為‘MV’;以應(yīng)用廣泛的樹名音為正碼。三.取碼方法1.拆分漢字,取部件讀音的第一個(gè)字母為代碼。分BD(八刀)。祁SE(礻阝)。八PN(丿ㄟ)。
2.取碼以四碼為限,超過(guò)四碼者,取前三碼和最后一碼。永DZZN(丶フㄟ)。
3.兩件字用二次分解法和反切法截取識(shí)別碼以分離同碼字。
兩件字分為三類第一類,以偏旁部件(附錄二的55件)或筆畫部件(共8件)為前件的兩件字,先作第一級(jí)分解,將字分解成兩個(gè)部件取主碼后,再作第二級(jí)分解,拆分后件,用單件反切法,先切取后件之首,然后反取后件之尾作識(shí)別碼。如篁‘ZH·BW’(_皇·白王);簧‘ZH·CB’(_黃·艸八);篌‘ZH·RS’(_侯·亻矢);乏‘PZ·DN’(丿之·丶ㄟ)。
第二類,以成字部件為前件的兩件字,先作第一級(jí)分解,將漢字分解出兩個(gè)部件取主碼后,再作第二級(jí)分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識(shí)別碼。如別‘LD·KG’(另刂·口 第三類,兩件字中后件若為不能拆分的單筆畫部件(‘一丨丶乙’等),省略識(shí)別碼。如‘釓’,取碼為‘JZ’(钅乚);‘釔’,取碼為‘JZ’(钅乙);‘丸’,取碼為‘JD’(九丶);‘斥’,取碼為‘JD’(斤丶)。
用于計(jì)算機(jī)漢字輸入,第三碼取該字讀音的第一個(gè)字母為識(shí)別碼,第四碼取i補(bǔ)位,如‘釓’(gá),取碼為‘JZGI’(钅乚·gáI);‘釔’(yǐ),取碼為‘JZYI’(钅乙·yǐI(xiàn));‘丸’,取碼為‘JDWI’(九、·wánI);‘斥’,取碼為‘JDCI’(斤、·chìI)4.三件字也作二次分解,將第三件拆分,取第三件之末件作為識(shí)別碼。如鶯‘CMN H’(卄冖鳥一)。犖‘CMN·S’(卄冖牛·丨)。
三件字的第三件若為不能拆分的單筆畫部件,省略識(shí)別碼。如及‘PZN’(丿ㄋㄟ)。用于計(jì)算機(jī)漢字輸入,第四碼取該字讀音的第一個(gè)字母為識(shí)別碼。如及‘PZNJ’(丿ㄋㄟ·jí)5.單筆畫的一件字(只“一乙”兩字,此兩字實(shí)際上是兩個(gè)筆畫部件),取其筆畫讀音定碼,用于計(jì)算機(jī)漢字輸入,再加補(bǔ)三個(gè)i作補(bǔ)位碼一HⅢ。乙ZⅢ。
6.詞語(yǔ)兩字詞先分別按兩字讀音的音首第一個(gè)字母定主碼,再將兩字切分用兩字反切法補(bǔ)上識(shí)別碼。如“中國(guó)”取碼為“ZG·KH”(中國(guó)·口一)。
三字詞先分別按三字讀音的音首第一個(gè)字母定主碼,再將第三字切分取最后一件定為識(shí)別碼。如“新氣象”取碼為“XQX·N”(新氣象·ㄟ)。
四字詞分別按四字讀音的音首第一個(gè)字母定碼。如“欣欣向榮”取碼為“XXXR”。
四字以上的詞,取前三字和最后一字各自讀音的音首第一個(gè)字母為編碼。如“西部大開發(fā)”取碼為“XBDF”。四.轉(zhuǎn)換與借位本編碼用于計(jì)算機(jī)漢字鍵盤輸入,將鍵盤中的英文字母鍵位轉(zhuǎn)換為漢語(yǔ)拼音字母鍵位使用。
其中英文字母鍵名V、U、I、O在本編碼中作為“借位代碼”,用于計(jì)算機(jī)漢字輸入借‘V’為含有‘ǖ’音的‘yu、yun、yue、yun’四音的代碼?!住?,輸入碼為‘VT·HT’?!妗?,輸入碼為‘WV·HE’。‘朋’,輸入碼為‘VV·JE’?!畡?dòng)’,輸入碼為‘VL·EP’。借“U”鍵位為“氵”的代碼,如“江”字,輸入碼為“UG·HH”;借“I”鍵位為“鄉(xiāng)”的代碼,如“編”字,輸入碼為“IB·HC”;借“O”鍵位為“扌”的代碼,如“打”字,輸入碼為“OD·HG”。五.部件筆畫部件。共有橫豎撇捺點(diǎn)折鉤挑(一丨丿ㄟ丶乙 )八件,按其讀音的音首第一個(gè)字母分別取字母H、S、P、N、D、Z、G、T,用于計(jì)算機(jī)鍵盤漢字輸入,相應(yīng)地定在鍵位H、S、P、N、D、Z、G、T上。其識(shí)別與使用詳見附表一。
偏旁部件共55件,按其讀音分別定碼,即定碼為B的是勹、 冫、廣;定碼為C的是卄、巛、束、镸;定碼為D的是刂、 定碼為E的是阝;定碼為G的是變形艮;定碼為H的是灬、巟、 定碼為J的是冂、卩、丬、巠或 段、钅;定碼為K的是凵;定碼為L(zhǎng)的是變形良;定碼為M的是一、宀、冃;定碼為P的是疋或 ;定碼為Q的是巧;定碼為R的是亻;定碼為S的是厶、彡、彐、纟、糸、_、 扌、饣、氵、礻;定碼為T的是乇;定碼為W的是攵;定碼為X的是 _、忄;定碼為Y的是乂、尢、 、讠、衤;定碼為Z的是廴、辶、 。其識(shí)別與使用詳見附表成字部件。成字部件取字范圍基本以GB2312的6763個(gè)漢字為準(zhǔn)。部分成字部件及其相似形的識(shí)別與使用詳見附表三。六.附表附表一
筆畫部件的名稱代碼及說(shuō)明部件 名稱讀音 代碼 說(shuō)明與例字一橫héng H 作漢字稱yī,作組字部件一律稱héng不稱yī一(H),三(HE),下(HB)。
丨豎shù S丿撇piě P 從右上方向左下方運(yùn)行提筆而收的,無(wú)論長(zhǎng)短都稱‘撇’匕飛學(xué)北步(下左為短撇,拆為‘止丨 丿’)。
ㄟ捺nà N 人之辶。
丶點(diǎn)diǎn D‘習(xí)’字第三筆為‘挑’,‘飛’字第二筆為‘撇’,‘北’字左下為‘挑’,右上為‘撇’,均不視作‘點(diǎn)’。
乙折zhé Z 指稱一切帶轉(zhuǎn)折的筆畫,包括_ㄥ ㄋ乚 等。另 此形順依一般稱法,稱‘折’不稱‘橫鉤’。甲乙的‘乙’作漢字單用時(shí)稱yǐ,作組字部件時(shí),稱為zhé,代碼為Z乙(Z),釔(JZ),釓(JZ)。
鉤gōu G 包括豎左鉤、豎右鉤 和斜鉤丁以弋。不包括帶轉(zhuǎn)折的鉤,如‘_’ 等。
挑tiǎoT 例北刁習(xí)兆。
附表二偏旁部件的名稱代碼及說(shuō)明部件名稱讀音代碼說(shuō)明與例字勹 包字框bāo B 例字包匍。
八字形bā B 包括在一切部位被中分的橫排而寫的兩筆。例字丫蘭益半卷豆小辦亦業(yè)夾傘善(羊 一口)潦。
冫 冰字旁bīn B 只限于左右結(jié)構(gòu)的左偏旁冰凍冷決馮?!?xí)飛斗棗’中的兩筆不劃入‘冰字旁’。有些字的左旁兩筆并不是‘冰’,本方案只重形,不重源,為了統(tǒng)一,在左者一律稱作冰字旁。
在其它部位者,不論屬‘冰’不屬‘冰’,一律不劃入‘冰字旁’。
疒病字頭bìngB艸草頭形chǎoC 在上(艸草)在中(卄垂)在下(廾弄),一律約定稱為‘草’。正例莽葬共開弄弊戒。相似形甘(廿二),其(廿三八)。
巛 三拐川chuān C 例字巡甾(zāi)巢邋(lā)鬣(liè)朿 刺字旁cì C 例字棘刺棗策?!畺c’本非偏旁部件,因不是現(xiàn)代通常用字,故納入偏旁部件。
镸 變形長(zhǎng)cháng C 例字套肆髟刂立刀旁dāoD只限于左右結(jié)構(gòu)的右偏旁?!畮焾?jiān)而介’這類字的兩豎(有的是撇與豎)不劃入‘刂’,而按兩個(gè)筆畫部件取碼。‘氘’,不取作‘氣刂’,而取作‘氣丿丨’。
ク斜刀dāo D例字危芻急負(fù)爭(zhēng)色龜免奐象詹久夕。只限于筆順相同的部件,不用于‘萬(wàn)方敖’等字,這些字里的‘ク’筆順是先折后撇?!贰珠_頭兩筆不視作‘ク’。
阝雙耳旁ěr E在左在右統(tǒng)稱為‘雙耳旁’。
變形艮 gèn G例字即既爵灬四點(diǎn)火huǒH例字然煮煎熬焉燕。‘燕’字四點(diǎn)本不是‘火’,本方案重形不重源,約定‘灬、’的代碼一律為‘H’。
巟偏旁巟huāng H例字荒慌謊。
虎字頭hǔH例字虎虐滹璩冂偏旁冂jiǒng J例字迥炯同貝巾見丹冊(cè)冉(冂丨二)而身敝曲典裔商骨日曰月。
卩 節(jié)字底jiē J例字節(jié)癤即爺命印衛(wèi)卯卸卿卻叩?!唷緸榉?jié)的‘節(jié)’,不稱單耳旁。在‘報(bào)服赧’等字里的相似形,也視作‘卩’。
丬 將字旁jiāng J經(jīng)字旁jīngJ 叚 假字旁jiǎ J假葭瘕遐瑕暇霞钅 金字旁J凵 偏旁凵kǎn K讀kǎn。例字凼兇。
變形良 liáng L例字郎朗。
冖 冪字頭mìM 冖是冪的古字。例字冪冥蒙農(nóng)冗孛鶴榮愛舜亭帝帶學(xué)常堂黨裳棠嚏帶沉骨。
宀 寶蓋宀miǎnM取古音讀為miǎn。
冃 冒字頭mào M‘冒’字的上件‘冃’,從冂從二,不是‘曰’?!啊謶?yīng)拆分為‘冃目’?!帷?,上件‘冃’,不是‘曰’?!帷謶?yīng)拆分為‘冃免’。例字冒冕勖帽瑁。
疋() 異體匹pǐ P稱腳讀shū。讀yǎ時(shí),古同‘雅’。又為‘匹’(pǐ)的異體字。本方案納入偏旁部件,取音為pǐ楚胥疏。
犭犬字旁quǎn Q例字狗貓狼猝狺(yín)獨(dú)獅。
亻單人旁rénR ‘在存’兩字的第二三兩筆作‘亻’字件取碼,‘在’拆為‘一亻土’?!妗瘎t拆為‘一仔’?!巍制鹗變晒P不視作‘亻’。
厶私字旁sī S 私幺公雄。
彐橫山shān S 例字當(dāng)芻急尋靈帚錄雪彗艮侵殷。包括下列字里中橫出頭的相似形事尹肅隸聿爭(zhēng)妻秉兼捷慧。
彡三撇旁shān S 例字杉釤衫須。
纟絞絲旁sī S 練細(xì)。
糸絲字旁sī S 讀sī時(shí),古為‘絲’字繁體(糸糸)的省寫,‘纟’本作‘糸’。
另讀mì,細(xì)絲。本方案取音為sī紊素。
生字主體shēS 例字生青隹(亻丶一 ng
氺變形水shuǐ S泰滕求。
扌提手旁 S饣食字旁 S氵三點(diǎn)水 S礻示字旁 S攵偏旁文wénW 小字形xiǎo X例字少光肖當(dāng)尚黨嘗賞東(七小)樂(lè)(丿_小)爾曾雀木未耒束柬秉敝?!弧帧弧氯P的筆順與‘小’字不同,不能視作‘小’。
_興字頭xīng X例字興學(xué)_變形心xīnX恭慕忝隳。
忄豎心旁 X乂偏旁乂yìY正例刈義艾殺父兇風(fēng)岡趙爽。相似形例字史吏更?!畞V’,本為漢字,并非偏旁部件,因不是現(xiàn)代通常用字,故納入偏旁部件。
尢尤字主體yóu Y例字尤(尢、)龍(尢丿、)。
禿尾羊yáng Y例字羔羲。
讠言字旁 Y衤衣字旁 Y廴建之旁zhī Z例字建延廷。
辶走之旁zhīZ走之旁建之旁,代碼同為‘z’。
爪字形zhǎo Z采受。
_竹字旁 Z以上55個(gè)為本編碼的全部偏旁部件,它們均屬不能單獨(dú)成字的部件。不在此55件之列的其它偏旁部件,如“匚 攵 ”等,均拆零處理。“彳(chì)豸(zhì)髟(biāo)”是次常用漢字,不是偏旁部件。
附表三部分成字部件及相似形部件字 讀音代碼 說(shuō)明二 èr E兩橫畫作‘二’字取碼時(shí),應(yīng)以上短下長(zhǎng)為準(zhǔn),否則不能當(dāng)作‘二’字取形?!酢?,前兩橫上長(zhǎng)下短,不能與‘丨’畫合成取作‘干’ 應(yīng)拆分為‘一土’?!畱狻?上短下長(zhǎng)),取為‘二し丿?!畾狻?上長(zhǎng)下短),取為‘丿一一乙’?!f’(上長(zhǎng)下短),取為‘一一 丨?!埂?,為‘千卄一一’?!亍癁椤簧甓?br />
七 qiQ相似形車東切長(zhǎng)。‘切’,左旁本為‘七’(從刀七聲),現(xiàn)規(guī)范為‘一し ’,本方案視作‘七’的相似形取碼。‘長(zhǎng)’的第二三兩筆也相應(yīng)地視作‘七’,‘長(zhǎng)’取為‘丿七ㄟ’。
bǔ B卜字形上貞占盧卣卓桌睿。
幾 jǐ S例凡朵風(fēng)凹(幾冂一)。
比字左旁biB比字左旁視作‘匕’的相似形比頃(只此二字)。‘化’、‘叱’、
‘齔’(chèn)字的右部為撇出頭,不視之為‘匕’。
木mù M木的相似形殺親茶。木字豎筆無(wú)鉤,‘殺親茶’此三字的有鉤的末件視作木的相似形。
罒sì S四字形(不視作‘目’)黑柬(一罒小)羅罹署罩?!癁椤畞R冂小一日’。
井jǐng J相似形例寒鞲。
曰yuè Y例字昌汩(gǔ)。約定只取‘昌’的下件‘汩’的右件從‘曰’(yuè),其它字的‘日’(rǐ)字形、‘曰’(yuè)字形,無(wú)論寬窄,作部件時(shí),一律約定為‘日’(rì)。注意‘冒冕’兩字上部不從‘曰’而從‘冃’(mào)。
月yuè Y相似形例且(月一)直(十月二)具(月二八)。斜月旁然炙。
變形止zhǐ Z例足走疋婕。
六字形liù L例字立交旁帝商摘滴冥毅子zǐ Z作偏旁的‘孑’,不讀jié,代碼一律為Z孩孤。
冊(cè)cèC冊(cè)字形扁嗣龠。
yáng Y歪尾羊羞差著。
1.一種順應(yīng)漢字的形與音拆分取碼的漢字編碼法,其特征是順形拆分;順音定碼;字、詞編碼長(zhǎng)度不大于四碼,不足四碼者,用二次分解法和反切法截取識(shí)別碼補(bǔ)位以分離同碼字。
2.如權(quán)利要求1所述的漢字編碼法,其特征在于二次分解法是先作第一級(jí)分解,將兩件字與三件字分解成部件,或?qū)勺衷~、三字詞詞條分解成單字,取主碼后,再作第二級(jí)分解,將部件或詞條里的單字拆分以便截取識(shí)別碼,兩件字以偏旁部件或筆畫部件為前件的兩件字,先作第一級(jí)分解,將字分解成兩個(gè)部件取主碼后,再作第二級(jí)分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識(shí)別碼;以成字部件為前件的兩件字,先作第一級(jí)分解,將漢字分解出兩個(gè)部件取主碼后,再作第二級(jí)分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識(shí)別碼,三件字先作第一級(jí)分解,將字分解成三個(gè)部件取主碼后,再作第二級(jí)分解,將第三件拆分,取第三件之末件作為識(shí)別碼,兩字詞先將詞條作第一級(jí)分解,按兩字讀音的音首第一個(gè)字母定主碼,然后再作第二級(jí)分解,將兩字切分,用兩字前后反切法補(bǔ)上識(shí)別碼,三字詞先將詞條作第一級(jí)分解,按三字讀音的音首第一個(gè)字母定主碼,然后再作第二級(jí)分解,將第三字切分取最后一件定為識(shí)別碼。
3.如權(quán)利要求1或2所述的漢字編碼法,其特征在于反切法是一種對(duì)兩件字或兩字詞切分反取的方法,前件為偏旁部件或筆畫部件的兩件字,先作第一級(jí)分解,將字分解成兩個(gè)部件取主碼后,再作第二級(jí)分解,拆分后件,用單件反切法,先取后件之首,然后反取后件之尾作識(shí)別碼;前件為成字部件的兩件字,先作第一級(jí)分解,將字分解出兩個(gè)部件取主碼后,再作第二級(jí)分解,前后兩件分別切分,用兩件反切法,前件取首,后件取尾,截取識(shí)別碼,兩字詞先作第一級(jí)分解,將詞拆成兩個(gè)單字,按兩個(gè)字的讀音取主碼后,再將兩字分別作第二級(jí)拆分,然后用前字取首、后字取尾的兩字反切法截取識(shí)別碼。
4.如權(quán)利要求3所述的漢字編碼法,其特征是筆畫部件有“一、丨、丿、ㄟ、、、乙、 ”八件,按其讀音的音首第一個(gè)字母分別取字母H、S、P、N、D、Z、G、T,用于計(jì)算機(jī)鍵盤漢字輸入,相應(yīng)地定在鍵位H、S、P、N、D、Z、G、T上。
5.如權(quán)利要求3所述的漢字編碼法,其特征是偏旁部件有55件,按其讀音分別定碼,即定碼為B的是勹、 冫、疒;定碼為C的是卄、巛、束、 定碼為D的是刂、 定碼為E的是阝;定碼為G的是變形艮;定碼為H的是灬、巟 定碼為J的是冂、卩、丬、 或 叚、钅;定碼為K的是凵;定碼為L(zhǎng)的是變形良;定碼為M的是冖、宀、冃;定碼為P的是疋或 定碼為Q的是犭;定碼為R的是亻;定碼為S的是厶、彡、彐、纟、糸、 水、扌、饣、氵、礻;定碼為T的是乇;定碼為W的是攵;定碼為X的是 ツ、 忄;定碼為Y的是乂、尢、 讠、衤;定碼為Z的是廴、辶、 _、
6.如權(quán)利要求1所述的漢字編碼法,其特征是順形拆分包括依照規(guī)范筆順、順應(yīng)漢字構(gòu)成拆分,隨字取形,部件容量取大不取小,部件級(jí)別取大不取小,上下結(jié)構(gòu)靠上不靠下,左右結(jié)構(gòu)靠后不靠前,中分取整,構(gòu)字部件取常不取偏。
7.如權(quán)利要求1所述的漢字編碼法,其特征在于順音定碼,按所取部件的普通話的讀音,取音首第一個(gè)字母為該部件的代碼,多音的表音部件則隨字定音,對(duì)于全部讀音均與本字讀音不一致或無(wú)關(guān)聯(lián)的多音偏旁部件,采用常讀音定碼。
本發(fā)明是一種順應(yīng)漢字的形與音拆字取碼的漢字編碼法,包括:順形拆分;順音取碼;字、詞編碼長(zhǎng)度不大于四碼,不足四碼者,用二次分解法和反切法截取識(shí)別碼補(bǔ)位以分離同碼字。本發(fā)明用于計(jì)算機(jī)漢字鍵盤輸入,簡(jiǎn)單易學(xué);用于辭書檢索,可以直接翻頁(yè),一步到位。 |