收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于改进混合CTC/attention架构的端到端普通话语音识别

杨鸿武  周刚  
【摘要】:端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率.

知网文化
【相似文献】
中国期刊全文数据库 前19条
1 杨鸿武;周刚;;基于改进混合CTC/attention架构的端到端普通话语音识别[J];西北师范大学学报(自然科学版);2019年03期
2 程建军;胡立志;;关于深度学习的语音识别应用研究[J];科技经济导刊;2019年12期
3 周弘烨;;语音识别大揭秘:计算机如何处理声音?[J];中国新通信;2019年04期
4 姜姝姝;;语音识别64年大突破[J];机器人产业;2016年06期
5 吴俊宇;;语音识别为何“叫好不叫座”?[J];通信世界;2016年16期
6 司马宁;;智能电视,语音识别或成突破口[J];消费指南;2017年05期
7 林小春;江宇娟;刘帅;;语音识别,或是人工智能下一“风口”[J];晚霞;2017年06期
8 艾散·帕合提;买尔丹·祖农;蔡亚永;;计算机语音识别与合成技术[J];中国新通信;2012年21期
9 德庆卓玛;;藏语语音识别研究综述[J];西藏大学学报(社会科学版);2010年S1期
10 杜利民;;生物特征识别技术之语音识别[J];中国自动识别技术;2007年03期
11 俞铁城;语音识别的发展现状[J];通讯世界;2005年02期
12 ;语音识别产业的新发展[J];通讯世界;2005年05期
13 ;语音识别[J];印刷世界;2004年01期
14 王艳琴,梁钊,蒙山;分布式语音识别的前端处理及相关标准[J];电声技术;2002年05期
15 ;语音识别的真相[J];个人电脑;2001年12期
16 郭远琼;提高语音识别率点滴[J];电脑技术;2000年03期
17 杨建华,赵力;基于VQ与HMM相结合的汉语数字语音识别(英文)[J];Transactions of Nanjing University of Aeronautics & Astronau;2000年01期
18 ;语音识别大开应用方便之门[J];电子产品世界;1999年11期
19 郑士贵;语音识别装置[J];管理科学文摘;1995年05期
中国重要会议论文全文数据库 前10条
1 熊军军;马瑞堂;李成荣;;儿童语音识别的研究现状[A];第九届全国人机语音通讯学术会议论文集[C];2007年
2 张冰;龙长才;罗海风;;熟悉掩蔽音背景下的目标语音识别[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
3 于东;贾磊;徐波;;面向语音识别错误恢复的澄清式疑问句生成[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 邢安昊;黎塔;颜永红;;利用二重打分方法的激活词语音识别[A];中国声学学会第十届青年学术会议论文集[C];2013年
5 文成义;何海燕;张玉扶;;基于新型神经网络的不定人语音识别[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
6 杜笑平;杨启纲;杨家沅;;过零周期转移概率矩阵语音识别部件的研制[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
7 潘胜昔;刘加;江金涛;王作英;陆大金;;基于多模式及集成判决的稳健电话语音识别算法研究[A];第五届全国人机语音通讯学术会议(NCMMSC1998)论文集[C];1998年
8 杜利民;;语音识别中的鲁棒性问题[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 张明新;倪宏;陈国平;张东滨;;一种用于并行模型噪声鲁棒语音识别的特征构造方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 贺苏宁;基于语音识别基元声学整体结构特征的识别模型研究[D];电子科技大学;2005年
2 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
3 徐金甫;基于特征提取的抗噪声语音识别研究[D];华南理工大学;2000年
4 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
5 沈海峰;语音识别中的环境补偿研究[D];北京邮电大学;2006年
6 李小兵;高效简约的语音识别声学模型[D];中国科学技术大学;2006年
7 孙暐;听觉特性与鲁棒语音识别算法研究[D];东南大学;2006年
8 雷建军;噪声鲁棒语音识别中若干问题的研究[D];北京邮电大学;2007年
9 孙成立;语音关键词识别技术的研究[D];北京邮电大学;2008年
10 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 徐海;基于语音识别的智能家居方案设计研究[D];浙江理工大学;2019年
2 陈长鑫;基于嵌入式技术及云技术的机器人语音识别研究[D];东北大学;2017年
3 潘莹;基于HMM的连续语音识别系统的设计[D];中南民族大学;2016年
4 朱明星;车载噪声背景下的语音识别中减噪技术研究[D];安徽工业大学;2018年
5 陈皇;基于神经网络的语音识别声学模型压缩研究[D];中国科学技术大学;2018年
6 王杰;基于深度神经网络的语音识别研究[D];沈阳工业大学;2018年
7 王旭东;基于波束形成与DNN的远距离语音识别方法研究[D];辽宁工业大学;2018年
8 张晓;基于频谱上下文的语音识别及情感分类算法研究[D];西北大学;2018年
9 徐旭东;语音识别中深度神经网络模型的研究与实现[D];湖南大学;2018年
10 吴佳欣;基于TANDEM特征的藏语拉萨方言语音识别的研究[D];西北师范大学;2018年
中国重要报纸全文数据库 前10条
1 本报记者 郭科;登月早已实现,同期启动的语音识别还在路上[N];科技日报;2018年
2 本报记者 王星平;语音识别商用尴尬 应用场景垂直化路有多远[N];中国企业报;2016年
3 陈宗周;机器在聆听[N];电脑报;2017年
4 《机器人产业》杂志副总编辑 姜姝姝;语音识别距人类只差0.4%?[N];北京日报;2017年
5 孙泽竑;语音识别:应用前景广泛[N];中国知识产权报;2017年
6 杨婧一;车音网创始人沈康麒:语音识别的无数个痛点[N];上海证券报;2015年
7 ;Intel涉足语音识别[N];计算机世界;2003年
8 本报记者 马文方;用互联网思维做语音识别[N];中国计算机报;2013年
9 本报记者 李映;语音识别飞入寻常百姓家?[N];中国电子报;2012年
10 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978