漢字形碼可能與漢字檢索相結(jié)合,做到“規(guī)則簡(jiǎn)單,易學(xué)易用”。
由于國(guó)家頒布了漢字筆順規(guī)范,為“以筆順排序”提供了可能性。
手機(jī)普及率高,數(shù)字碼有利于推廣。
國(guó)學(xué)離不開繁體字,理想的漢字形碼將為繁體字的檢索、錄入、閱讀提供方便。
探討“理想的漢字形碼”能夠?yàn)槲覀冎该餮芯康姆较颍僮邚澛贰U_的決心來源于正確的判斷。人們希望它能解決什么問題?它應(yīng)該有什么特點(diǎn)?這些應(yīng)該成為正確判斷的組成部分。
一個(gè)好的形碼應(yīng)該具有以下特點(diǎn):
1.王永民的五筆字型從專業(yè)角度解決了漢字形碼,但從普及和啟蒙角度來看,難度太大,門檻太高。要求“化難為易”。
2.見到一個(gè)讀不響的方塊字,想要知道它的讀音和它的意思,只有去查字典,或者叫“檢索”。通過字形查字典是個(gè)難點(diǎn),新華字典的部首檢字表有75頁,其中的規(guī)則并不容易,一般要到三年級(jí)才能較快地查到一個(gè)生僻字。就是說,漢字檢索的規(guī)則太復(fù)雜。在對(duì)外漢語教學(xué)和民族漢語教學(xué)中這也是一個(gè)難點(diǎn),同樣希望“化難為易”。
3.在當(dāng)今的信息時(shí)代,書面字典的檢索應(yīng)該與漢字編碼結(jié)合起來。理想的漢字形碼同時(shí)又是理想的漢字檢索方法。“規(guī)則簡(jiǎn)單,易學(xué)易用”就是理想的標(biāo)準(zhǔn)。同時(shí),查字與漢字輸入結(jié)合,提高使用頻度,熟能生巧,能夠提高查字效率,提高孩子學(xué)習(xí)查字的興趣。
4.碼元有拉丁字母和阿拉伯?dāng)?shù)字兩種選擇,由于手機(jī)普及率遠(yuǎn)高于電腦,故碼元應(yīng)以數(shù)字為宜。缺點(diǎn)是平均碼長(zhǎng)會(huì)有所加長(zhǎng),但與T9拼音數(shù)碼令人厭煩的多次翻頁相比,這個(gè)缺點(diǎn)就是并無大礙了。
5.形碼取碼的對(duì)象有兩種選擇:筆劃、部件(如偏旁部首)。采用部首時(shí)要記住200個(gè)左右的部件,這是個(gè)妨礙普及的障礙,以筆劃為主則可以避開。然而,用“12345”對(duì)應(yīng)“橫豎撇點(diǎn)折”,“67890”就閑置浪費(fèi)了。為了充分利用碼元,經(jīng)過整理用10個(gè)數(shù)碼表示5個(gè)筆劃和28個(gè)最常用部件,使得碼元平均所代表的部件數(shù)不超過5個(gè)。符合人類記憶的特點(diǎn),有利于記憶效率的提高。利用筆劃,一種辦法是四角號(hào)碼,規(guī)則有難度。一種是按筆順,符合大眾習(xí)慣。采用筆順有一個(gè)有利的前提條件,就是政府已公布了國(guó)家漢字筆順規(guī)范GF3003-1999(2000.1.1實(shí)施)。如果人們都在隨意使用無序的倒插筆,筆順這個(gè)資源就不能夠被利用。所以一個(gè)權(quán)威的國(guó)家規(guī)范,是絕對(duì)必要的技術(shù)基礎(chǔ)。利用筆順的漢字輸入法有利于漢字書寫的規(guī)范化。
6.簡(jiǎn)體漢字與繁體漢字使用同一個(gè)規(guī)則,有利于繁體字的健康回歸。推行簡(jiǎn)化字是文字改革的重大步驟,據(jù)稱能大幅提高識(shí)字效率,降低文盲率。可惜,半個(gè)世紀(jì)的實(shí)踐證明,簡(jiǎn)體字的我國(guó),新文盲源源不斷,繁體字的香港和臺(tái)灣卻消除了文盲,所以把繁體字指責(zé)為文盲現(xiàn)象的罪魁禍?zhǔn)资遣环聦?shí)的。而把繁體字邊緣化卻為群眾學(xué)習(xí)了解國(guó)學(xué)人為地設(shè)置了障礙。為漢字文化圈內(nèi)文化交流增加了不必要的的困難,對(duì)我國(guó)的改革開放造成了消極影響。怎樣消除這些文改后遺癥?應(yīng)該為繁體字的檢索、電腦錄入、以及閱讀創(chuàng)造物質(zhì)條件。本項(xiàng)目就是努力之一。
項(xiàng)目的階段成果
1.6763一二級(jí)漢字中,共有重碼872組,其中二字重碼635組,三字重碼160組,四字重碼50組,五字至九字重碼共26組,13字重碼1組。鍵選率不高,鍵選時(shí)基本不翻頁,為詞輸入簡(jiǎn)碼提供了條件。
2.GBK的21000字編碼已完成,現(xiàn)正向7萬字方向擴(kuò)展。
【作者單位】漢字文化教育研究中心 |