• 14阅读
  • 0回复

汉王笔遒任纵横——记中自汉王科技公司 [复制链接]

上一主题 下一主题
离线admin
 

只看楼主 倒序阅读 0 发表于: 1996-12-25
第5版(教育·科技·文化)
专栏:“863计划十年巡礼”

  汉王笔遒任纵横
——记中自汉王科技公司
本报记者陈祖甲
走进中科院自动化所,在白楼一层,有一处门上写着“汉王99”几个大字。这里就是北京中自汉王科技公司。这个高技术企业专门从事研究、开发和销售手写汉字识别的热门软件——“汉王99”系列产品。
可为什么要称“汉王99”呢?
公司总经理、“汉王99”的研究创始人刘迎建说,“汉王99”是表明公司在研究、开发手写文字识别软件方面,期待达到99%的文字识别率和99%的用户。
信息技术以电子计算机为核心。要使计算机用得得心应手,文字输入是人们越来越关心的问题。计算机产于西方,那里的文字同计算机键盘上的键钮是一致的。可在中国就不一样,汉字输入似一个细长的瓶颈。目前,我国研究汉字编码的人才比比皆是,编码已达1000多种,专利600多项,生产软件的公司几十家。可我们用哪一种呢?诸多编码大体分为数字、音码、形码三大类输入法,各有千秋。使用者明白,用着也各有难处:默默地念读输入音码,常常为一个字音拼不准而尴尬万千;打形码则需拆字体、背字根、记规则、练指法,复杂繁琐,常常令人不得要领。难怪一位专业写作人员买了计算机不用,心向往之却畏难作罢,计算机成了摆设。
凡是会写汉字的人都明白,写汉字有个笔顺问题。同一个汉字有的人先写外后写里,先写左后写右,有的人则相反。计算机能否都识别?刘迎建起初研制了初联机手写汉字识别系统,既不受笔顺限制,又有实用价值。这项成果获得北京市优秀软件一等奖。
与此同时,中科院院士、中科院自动化所研究员戴汝为在80年代初,研究汉字识别理论。他带领一个小组,建立了以语义句法模式识别为基础的汉字识别理论。戴先生对刘迎建的成果颇感兴趣,破格录取他为自己的博士研究生。当时世界上有不少人在研究手写汉字输入。刘迎建认为,研究汉字输入负担重,但“不能指望外国解决”。他带领自动化所文字识别实验室的成员,承担了“863”计划和国家自然科学基金会资助的科研项目。
刘迎建认为,解决手写汉字识别问题有两个关键:一个是怎样采集汉字笔迹,另一个是怎样认识汉字笔迹。
现在的汉王笔是他们研究的一项产品:一支笔,一块同计算机连接的字迹采集板和识别软件。记者在机房里坐下,提起汉王笔,在板上轻轻地划动,屏幕上立即显出笔迹,同时显示一个工整的印刷体字。
字迹识别可是件复杂的事。手写字一人一个样,千变万化。为了采集样本,寻找规律,他们在首都机场设了点,请来往过客留下习惯的字迹。这样他们采集了160万字的样本。据介绍,他们公司已经掌握的字样库已达到400万字。好大的工程!
他们应用戴先生的理论与方法,分析样本。第四版手写汉字识别软件终于在1991年开发成功。这套软件不仅能认识不限笔顺的手写汉字,就是众多的连笔手写字也能识别。此外,还解决了印刷字文本、手写文本顺利地输入计算机的问题。这项成果获得国家专利、中国科学院自然科学一等奖。许多名牌笔记本电脑,诸如“快译通”、“名人”、“神宝”等都采用了汉王笔。目前,在国内市场已占到90%。
去年,汉王笔第六版接受了“863”计划智能计算机主题办委托的专家的鉴定,结果确认汉王笔简体字、繁体字和部分异体字达1.3万多个。如果初学者书写工整,能识别90%,熟练后可达99%。如果懂得日文、韩文,也有同样的专用识别软件。专家们说:“该系统识别字数多,书写限制少,自行研制的书写板手感良好,在识别性能方面处于世界领先水平。”
汉王笔遒任纵横。汉王笔正在向新台阶迈进。识别率更高的第七版即将面世!
快速回复
限200 字节
 
上一个 下一个