• 30阅读
  • 0回复

在奇妙的声学世界里——记俞铁城在用口令指挥机器研究中取得成果 [复制链接]

上一主题 下一主题
离线admin
 

只看楼主 倒序阅读 0 发表于: 1979-10-06
第4版()
专栏:

在奇妙的声学世界里——记俞铁城在用口令指挥机器研究中取得的可喜成果
建国三十周年前夕,我们来到中国科学院声学研究所语言识别组的电子计算机房。一位年轻的科学工作者手拿一张算术题目单,对着电子计算机的话筒,下达口令:“请算题”。计算机的指示灯忽闪忽闪几下之后,电传打印机上回答:“行(OK)”。这位科学工作者接着下达口令:“开始”。计算机便打印出:“准备就绪(READY)”。接着,这位青年立即口授一道道题目,计算机在“等于”、“打印结果”的口令下,迅速将数学题目和结果打印出来……。
用口令指挥电子计算机的这位青年,是声学所的俞铁城。
奇妙,真是奇妙。《一千零一夜》不是有这么一段有趣的故事吗:有人走到山前,口呼:“芝麻,开开门来!”山前的石门就打开了。然而,这在当时,只是美妙的幻想,而现在,却已经变成了事实。
计算机到底是怎样听懂人的话的?它有些什么用途,前景怎样呢?我们采访了俞铁城和声学所的其他同志。
一九七○年三月,二十九岁的俞铁城参加首钢炼钢自动化渣化组工作,亲身经历了炉前高温条件下工作的艰苦和危险。他想:要是能用语音直接控制机器,用口令在远距离上自动控制机器人去操作,那有多好啊!
本来,声学研究所开展语言识别研究已有十年历史,成绩不少,也遇到很多困难。俞铁城是刚参加这方面工作的。当时组里没有电子计算机。后来,在郭沫若院长亲自支持下,他们四处奔走,八方求援,终于要到了一台小型通用计算机。但是,要使机器听懂人的话,必须要对话音进行大量的分析,揭示出它的规律性,然后将物理模型演变为数学模型,进一步变成计算机能够工作的程序。为此,他请了好多同志发音,积聚大批语音资料。一天,俞铁城坐在办公桌前,凝视窗外,柳树梢在随风摆动,一阵气笛声忽悠悠传来。他灵机一动:为什么一听就知道它是气笛声而不是人的话音?要是人喊一个啊——,一直啊下去,那听起来就没有什么意义……。他进一步想:对了,人的话音主要靠声音有规律的变化,才能显示意义。好!我们不能照搬外国声学家通常用稳定音的信息来识别的方法,得抓住话音变化时的信息来进行识别。俞铁城按照自己的思路,开始设计程序,教计算机如何去识别话音。一次次的失败,一点一滴的成功。为此日复一日,月复一月,年复一年,不断思索着自己方案的优缺点。语言识别组的同志们向他提出很多积极的意见,并参加了工作。我国著名声学家马大猷、著名物理学家汪德昭亲自关心和指导他的工作,所党委书记还亲自解决设备条件上存在的问题。俞铁城决心取诸家之长,走自己的路。外国一般用伸缩橡皮筋似的办法去解决发音快慢的变化,而他觉得这不如用语音的变化情况,因此采用了新的物理量,更好地解决了发音快慢的变化。外国有时强调强音的重要性,而忽略了过渡音的作用,他则认为语音过渡是个完整过程,过渡音在语言中的作用不能忽视。经过千百次的反复实验,机器能听懂他的话了。接着,他又完成了一个“通用实时语言识别系统”,能听上百条口令。不管你用什么口音的话训练它,它都能听懂。现在,如果你应用俞铁城的口呼算题程序,只要张嘴报题,计算机就会做加、减、乘、除和方次运算。你一说多少加多少,多少乘多少……,机器马上照着打印,并立即打印出结果。错了,它可以纠正。你要它休息,它马上休息。你喊工作结束,它就停机。最近有位同志因为手头有大量的数据列在表格中,俞铁城编了一个用口令汇集数据的程序,可以将数据直接报给计算机,也可以叫它穿到纸带上,非常方便。一次实用,共呼音一千二百次,仅在一处“逗号”出错二次,正确率超过百分之九十九点八,其语言识别的正确度已达到国际先进水平,而在语言信息处理方面,还有自己的独到之处。来自美国、法国、英国、意大利、西德、日本、丹麦等国家的声学家和学者,参观后给予了良好的评价。有位同行的法国老教授说:“这是我所看到最好的。”
随着电子时代的展开,五光十色的现代化奇迹不断涌现,人工听觉智能将逐渐配备给机器人,无限美好的高级自动化将展现在人们的面前。但是,现有的系统还不适于无限扩展。往更高级的方面发展,广泛地用于人类的活动中和社会生产中,还需要做长期的努力,攻克很多的难关。俞铁城等同志决心再接再厉,攀登更高的科学高峰。
本报记者 何黄彪
快速回复
限200 字节
 
上一个 下一个