科技界 新科技新应用
首页 /  科普知识 /  内容

语音识别技术的发展历程

科普知识 2023-06-04 08:00:31 钟大作作

语音识别技术的发展历程可以追溯到20世纪50年代,但直到近年来,随着深度学习技术的出现和发展,语音识别技术才得到了飞速的发展。随着人工智能技术的不断发展,语音识别技术已经成为人们生活中不可或缺的一部分。目前,语音识别技术已经广泛应用于智能语音助手、智能家居、语音搜索等领域,并且取得了显著的进展。

声学模型是语音识别系统中关键的部分,它的作用是对声学单元产生的特征序列进行描述,对语音信号进行了分类。我们可以用声学模型来计算一段观测到的特征矢量属于各个声学单元的概率并声学模型、语言模型和解码器,有些框架也包括前端处理和后处理。随着各种深度神经网络以及端到端技术的兴起,声学模型是近几年非常热门的方向,业界都纷纷发布自己新的声学模型结构,刷新各个数据库的识别记录。

语音识别另外两个技术部分:语言模型和解码器,目前来看并没有太大的技术变化。语言模型主流还是基于传统的N-Gram方法,虽然目前也有神经网络的语言模型的研究,但在实用中主要还是更多用于后处理纠错。解码器的核心指标是速度,业界大部分都是按照静态解码的方式进行,即将声学模型和语言模型构造成WFST网络,该网络包含了所有可能路径,解码就是在该空间进行搜索的过程。

语音识别的目的是让机器可以理解人类,因此转换成文字并不是最终的目的。如何将语音识别和语义理解结合起来可能是未来更为重要的一个方向。

让机器听懂人类语言,仅靠声音信息还不够,“声光电热力磁”这些物理传感手段,下一步必然都要融合在一起,只有这样机器才能感知世界的真实信息,这是机器能够学习人类知识的前提条件。而且,机器必然要超越人类的五官,能够看到人类看不到的世界,听到人类听不到的世界。

从更长远来看,研究者将会关注如何教计算机不只是转录来自人类嘴巴的声音信号,而是回到20世纪50年代到70年代语音识别领域专家的最初设想:让计算机理解自然语言,用电脑模拟人脑。

版权申明:文章由用户发布,不代表本网站立场,如果侵权请联系我们删除。