• 78阅读
  • 0回复

“赢得灵心万口夸” [复制链接]

上一主题 下一主题
离线admin
 

只看楼主 倒序阅读 0 发表于: 1990-04-04
第5版(国内专页(教科文))
专栏:

在宽畅的会议大厅里,坐满了来自世界各国和全国各地的数千名客商、科研人员,他们正在凝神静听一个女孩子讲演“汉字全息码”……
  “赢得灵心万口夸”
吴培恭
这个女孩子叫杜冰蟾,今年15岁,是上海南洋模范中学初三学生。她经过3年潜心研究,发明了“汉字全息码”,在汉字电脑化方面取得新的突破。报纸报道了这个消息后,引起了社会各方的关注和重视。她被特邀参加最近在海南省海口市举行的规模盛大的“双交会”,介绍自己的发明,向国内外推广。
妈妈一句话使她开了窍
小冰蟾从小勤奋好学,善于思考。
前几年,她的爸爸、中年辞书专家杜晓庄主编王竹溪《新部首大字典》。爸爸工作时,她常在旁边问这问那。王竹溪在分解汉字时,有一条先高后低的法则,有一次,碰到“义”字,到底“、”高,还是“乂”高,就把人难住了。
小冰蟾忽然说:“能不能按笔划顺序来分解汉字部首呢?”
爸爸眼睛一亮,鼓励她说:“这个想法很好。你也可以搞一套新的汉语检索方法嘛。但分解所有汉字,不是一件容易的事,要花大量的时间来研究。”
她爸爸收藏着大量辞书,她就去翻阅,看别人是怎样分解汉字部首的,她看到东汉许慎的《说文解字》是540个部首,明代梅膺祚的《字记》和清代《康熙字典》是214个部首,现代《新华字典》是189个部首。小冰蟾开始了自己的研究。
大约有两年时间,小冰蟾始终在200个部首表左右徘徊,面对着长长的从001—200的数码表,总觉得很难编码,既难于归入26个拉丁字母,也归不进两位数码。她寝食不安,冥思苦想。
有一次,她妈妈催她赶快吃饭,她听不进去,仍在用筷子在桌子上划个不停。
她妈妈心里着急,突然冒出一句:“为什么一定要200个部首呢?100个不是很好吗!中国人喜欢100,100很吉利的。”
小冰蟾一下子开了窍,高兴地说:“对!对!用100部首,从01到00可以编进两位数的数码,归进26个拉丁字母,容易编码!”这一天她从下午一直写到深夜,删去100个部首字,取出组字能力最强的100个部首表。一张眉目清楚、一目了然的“100部首表”诞生了。
自修数学派了大用场
小冰蟾在研究发明“汉字全息码”时,遇到了排列组合和概率分布的离散数学问题,而这些数学知识,她在初中教科书中都还未学到。
1989年整个暑假期间,她提前学习了高三教科书中的排列组合部分,初步掌握了介于初等数学和高等数学之间的离散数学知识。她从电话号码的排列中获得启发,认识到汉字编码要用到“重复排列”的公式。她运用这个数学工具,意识到用足26个字母比少用一个字母,要增加离散度6万多,可以大大减少重码率。她发现拼音中的“O”很难对应部首字,于是小冰蟾聪明地把“O”作为去重码的功能键,在组字能力特别强的25个键各部首后面跟一个“O”,在后面多部首字中将“O”码代为续笔部首,通过插入“O”并移动“O”达到去重码的目的。
熬夜对她是家常便饭
小冰蟾在选定100个部首的正体与变体时,真是煞费苦心。每裁减、确定一个部首字,往往要化掉大量的精力和时间。比如“子”字,是一个组字能力较强的、常见常用的部首字,却容易造成重码。对这个收不进又丢不掉的“子”字,小冰蟾真是伤透了脑筋。在翻阅过大堆大堆的辞书仍一无头绪之后,她疲倦地打开许慎的《说文解字》,一个“了”字部首闪进她的眼睛,她高兴得跳起来。于是,她采用了“了”字部首,删去了“子”字部首,连夜将有关汉字重新编码,一连编了几个通宵,发现“了”字组字能力更强,而且不会重码。
在编码最紧张的半年时间里,她有时几乎通宵工作。晚上做完功课,已是八点多,就动手编写,到次日凌晨一二点,然后睡几个小时,就起来上学。
盈盈十五展才华
在汉字编码领域,可以说是名人辈出,强手如林。
小冰蟾从资料中了解到,至今已有400多套编码,已经实用的有近10种。小冰蟾并不满足于这些,继续钻研,经过3年夜以继日的苦苦探索,终于发明了“汉字全息码”。这个全息码将100个初小学生都能识读的最常用部首字,依26个拼音字头和笔画数,依书写汉字的7条笔顺的习惯法则分解部首,排出了4个拉丁字母和6位数的等长码,使6万个汉字与数十万条汉语词汇都能方便地输入电脑和用电波传送。这样,就使具有小学文化水平的用户不经过专门训练,就能编码上机。
“汉字全息码”可以广泛用于中文电脑打字、编辑、排版、电报、电传、邮政编码、中外文机器助译、古汉语与现代汉语助译、速记、速抄、缩写,以及图书编目、辞书索引等方面,促进了汉字电脑化。
华东师范大学老教授、著名文史专家苏渊雷挥毫作诗,给予高度评价:“赢得灵心万口夸,盈盈十五展才华。珠盘手落追风雨,压倒群贤四百家。”
快速回复
限200 字节
 
上一个 下一个