俄罗斯科学院无线电与电子技术研究所科研人员安齐佩罗夫开发出一种全新的计算机语音识别系统。通过实验发现,语音频谱中最基本的成分接近1千赫。 安齐佩罗夫指出,
理论上最智能的语音识别系统应该像人的大脑一样,能在瞬间从大量声音中分辨出已知的声音,而不依赖声音的大小和声调。目前的计算机识别系统还没有达到这种水平。每种声音对机器识别系统来说,仍是独一无二的,因此需要在机器上进行训练。由于长期训练的结果,在计算机的存储系统中形成了一个信息库,将某种声音的大量方案存储到这里,当计算机遇到某种声音时,就在这个信息库里进行挑选加工,然后选出某种可能的方案。
安齐佩罗夫在解释自己开发的语音识别系统时指出,这一独特的语音识别系统最主要的是考虑了语音的分级体系,从中辨别语音中最基本的成分,就像鉴别音乐中的音调一样,在宽广的语音频谱中,分辨出语音中最基本的具有思维性质的声音频谱。实验表明,这个频谱的范围接近1千赫,而其他那些带有情感色彩的语调,属于心理物理学范畴。
安齐佩罗夫进一步介绍说,在上述理论指导下,他开发的计算机语音识别系统接近大脑的识别功能:计算机在系统程序的指导下,将语音背景的个性成分清除,保留语音中最基本的成分,最大可能地简化了计算机的工作。在实验中,科研人员让十几人用不同声音进行实验,结果发现,计算机能够避开那些带有情感色彩的语调的干扰,准确地通过语音中最基本的成分辨别声音,1000比特的内存就能识别所有的数字和一些简单的语音
有关专家指出,该识别体系不仅达到了快速辨别语音的能力,还使计算机的存储时间和内存降低。该科研成果最适合大量的移动电子装置领域。 来源: 科技日报