《计算机工程与应用》2007年09期 加入收藏    获取最新 
 人脸动画中语音可视化算法研究进展
 周东生;张强;魏小鹏
   从人脸动画合成技术的发展、特点及应用出发,介绍了五种主要的人脸动画合成技术,重点对语音驱动的人脸动画中矢量量化、高斯混合模型、神经网络、隐马尔可夫等四种语音可视化算法的特点进行了对比分析,展望了语音可视化算法的发展与应用前景。
【作者单位】:大连理工大学机械工程学院;大连大学辽宁省智能信息处理重点实验室;大连大学辽宁省智能信息处理重点实验室 辽宁大连116028 大连大学辽宁省智能信息处理重点实验室;辽宁大连116622;辽宁大连116622;辽宁大连116622
【关键词】:人脸动画;语音处理;语音可视化
【基金】:辽宁省高等学校优秀人才支持计划资助(No.RC-05-07);辽宁省教育厅科技攻关计划资助(No.05L020);大连市科技计划资助(No.2005A10GX106);辽宁省智能信息处理重点实验室开放课题资助。
【分类号】:TP391.42
【DOI】:CNKI:ISSN:1002-8331.0.2007-09-010
【正文快照】:
  1引言合成生动逼真的说话者人脸动画一直以来是计算机图形学及多媒体技术领域的一个研究热点,也是一个难点。会说话的人脸动画可以广泛应用于电影、广告动画、在线新闻发布、虚拟演员、计算机游戏、人机接口、计算机辅助手语教学以及心理学、认知科学等许多领域[1]。自从Parke在20世纪70年代对人脸动画所作的开创性工作以来[1],到目前为止,至少存在5种基本的人脸动画合成途径。1972年,Parke[2]首先提出了关键帧插值技术,该技术采用大量手工标定的方式,能够产生大范围的脸部变化。随后Parke等人[1,3,4]提出了参数化技术,该技术利用几何线框…
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 Progress in audio-visual conversion algorithms in facial animation
 ZHOU Dong-sheng1;2;ZHANG Qiang2;WEI Xiao-peng21.School of Mechanical Engineering;Dalian University of Technology;Dalian;Liaoning 116028;China 2.Liaoning Key Lab of Intelligent Information Processing;Dalian University;Dalian;Liaoning 116622;China
  Five main types of synthesized technology of facial animation are introduced from the point of development,characteristics and application of facial animation. Comparison and analysis on the four typical audio-visual conversion algorithms including vector quantization,Gaussian mixture model,neural networks and hidden markov model in speech-driven facial animation are laid emphasis on in this paper. In addition,the development and possible applications are also discussed.
【Keyword】:facial animation;speech processing;audio-visual conversion algorithms
 【参考文献】 共(26)篇 
 中国期刊全文数据库找到 8 条
 
1单卫,姚鸿勋,高文; 唇读中序列口型的分类 [J];中文信息学报; 2002年01期
2王志明,蔡莲红,艾海舟; 基于支持向量回归的唇动参数预测 [J];计算机研究与发展; 2003年11期
3王洵,张道义,董兰芳,万寿红; 三维语音动画聊天室的设计与实现 [J];计算机工程与应用; 2004年01期
4王奎武,王洵,董兰芳,陈意云; 一个MPEG-4兼容的人脸动画系统 [J];计算机研究与发展; 2001年05期
5晏洁; 文本驱动的唇动合成系统 [J];计算机工程与设计; 1998年01期
6陈益强,高文,王兆其,姜大龙; 基于机器学习的语音驱动人脸动画方法 [J];软件学报; 2003年02期
7徐成华,王蕴红,谭铁牛; 三维人脸建模与应用 [J];中国图象图形学报; 2004年08期
8叶静 ,董兰芳 ,王洵; 用于语音动画合成的语音特征提取和聚类技术 [J];微型机与应用; 2004年08期
 西文参考文献找到 10 条
 
1Parke F I,,Waters K; Computer facial animation[M] [M];; 1996年
2Parke F I; Computer generated animation of faces[D] [M];; 年
3Parke F I.; A parametric model for human faces[D]. [M];; 年
4Parke F I; Parameterized models for facial animation[J] [M];IEEE Com-puter Graphics and Applications; 1982年
5Platt S M,Badler N I; Animating facial expressions[J] [M];Computer Graphics; 1981年
6Waters K; A muscle model for animating three-dimensional facial expressions[C] [M];Computer Graphics(SIGGRAPH’87); 1987年
7Thalmann N M,Primeau N E,Thalmann D; Abstract muscle actions procedures for human face animation[J] [M];Visual Computer; 1988年
8Lee Y; Realistic modeling for facial animations[C] [M];Proc SIGGRAPH; 1995年
9Morishima S,,Aizawa K,harashima H; An intelligent facial image coding driven by speech and phoneme[C] [M];Proc IEEE ICAGS’P; 1989年
10Linde Y,Buzo A,Gray R; An algorithm for vector quantizer design[J] [M];IEEE transactions on communications; 1980年
 【共引文献】 共(64)篇 
 中国期刊全文数据库找到 10 条
 
1李刚,王蒙军,林凌; 采用非对称唇形轮廓模型提高汉语唇形识别效果 [J];光学精密工程; 2006年03期
2贾清秀; 杜威的“儿童中心论”教育理论及其对我国学校体育改革的启示 [J];大众科学(科学研究与实践); 2007年02期
3何良华,邹采荣,包永强,赵力; 人脸面部表情识别的研究进展 [J];电路与系统学报; 2005年01期
4吴志勇,蔡莲红; 基于动态贝叶斯网络的音视频双模态说话人识别 [J];计算机研究与发展; 2006年03期
5李笑岚,查红彬; 重建发型的真实感头部建模 [J];计算机辅助设计与图形学学报; 2006年08期
6王洵,张道义,董兰芳,万寿红; 三维语音动画聊天室的设计与实现 [J];计算机工程与应用; 2004年01期
7吴丹,林学訚; 人脸表情视频数据库的设计与实现 [J];计算机工程与应用; 2004年05期
8王洵,董兰芳,万寿红; 基于MPEG-4的真实感人脸技术 [J];计算机工程与应用; 2003年22期
9童晶,关华勇; 面向影视动画的真实感三维人脸快速建模算法 [J];计算机应用; 2007年04期
10王姝,刘小丹; 一种个性化三维人面模型及其绘制方法 [J];计算机应用; 2007年05期
 中国优秀硕士学位论文全文数据库找到 10 条
 
1崔双博; 口型识别中唇的分割及曲线拟合 [D];华北电力大学(北京); 2006年
2纪运红; 智能视觉监控系统若干关键技术研究与实现 [D];辽宁科技大学; 2007年
3傅蓉; 文本-可视语音合成系统的研究及实现 [D];新疆大学; 2005年
4吕江波; MPEG-4兼容的人脸语音动画系统及其在网络通信中的应用 [D];浙江大学; 2003年
5张志文; 唇部检测算法的研究与实现 [D];浙江大学; 2007年
6黄琳; 视频监控系统中的关键技术研究 [D];西南交通大学; 2006年
7顾淼; 图像驱动的三维人脸动画研究 [D];南京理工大学; 2006年
8邓广宏; 基于内嘴唇的口形特征提取和聚类算法的研究 [D];哈尔滨工业大学; 2006年
9张国锋; 基于图像的人脸建模技术研究 [D];西北大学; 2004年
10陶宏; 基于视频图像的唇读识别技术的研究 [D];江苏大学; 2005年
 中国博士学位论文全文数据库找到 4 条
 
1刘晓宁; 基于三维模型的人脸识别技术研究 [D];西北大学; 2006年
2方帅; 计算机智能视频监控系统关键技术研究 [D];东北大学; 2005年
3姜大龙; 真实感三维人脸合成方法研究 [D];中国科学院研究生院(计算技术研究所); 2005年
4邹北骥; 人脸造型与面部表情动画技术研究 [D];湖南大学; 2001年
 中国重要会议论文全文数据库找到 3 条
 
1吴志勇,蔡莲红,蒙美玲; 可视语音合成中基于音视频关联模型的视位参数优化 [A];第八届全国人机语音通讯学术会议论文集 [C]; 2005年
2吴志勇,蔡莲红,蒙美玲; 可视语音合成中基于音视频关联模型的视位参数优化 [A];第八届全国人机语音通讯学术会议论文集 [C]; 2005年
3陶建华,谭铁牛; 语音和人脸表情同步的双模态情感表达研究 [A];第一届中国情感计算及智能交互学术会议论文集 [C]; 2003年
 【二级参考文献】 共(34)篇 
 中国期刊全文数据库找到 10 条
 
1高文,金辉; 面部表情图像的分析与识别 [J];计算机学报; 1997年09期
2王奎武,王洵,董兰芳,陈意云; 一个MPEG-4兼容的人脸动画系统 [J];计算机研究与发展; 2001年05期
3姚鸿勋,刘明宝,高文,范旭彤,张洪明,吕雅娟; 基于彩色图像的色系坐标变换的面部定位与跟踪法 [J];计算机学报; 2000年02期
4金辉,高文; 人脸面部混合表情识别系统 [J];计算机学报; 2000年06期
5王奎武,董兰芳,王洵,陈意云; 基于MPEG-4的人脸变形算法的研究 [J];计算机辅助设计与图形学学报; 2002年01期
6张翔宇,华蓓,陈意云; 人脸建模和动画的基本技术 [J];计算机辅助设计与图形学学报; 2001年04期
7高文,吴枫; MPEG-4编码的现状和研究 [J];计算机研究与发展; 1999年06期
8姚鸿勋,高文,李静梅,吕雅娟,王瑞; 用于口型识别的实时唇定位方法 [J];软件学报; 2000年08期
9徐琳,袁保宗,高文; 真实感人脸建模研究的进展与展望 [J];软件学报; 2003年04期
10陈益强,高文,王兆其,姜大龙; 基于机器学习的语音驱动人脸动画方法 [J];软件学报; 2003年02期
 西文参考文献找到 10 条
 
1Lee M W, Ranganath S; Pose-invariant face recognition using a 3D deformable model [M];Pattern Recognition; 2003年
2Terzopoulos D, Waters K; Physically-based facial modeling,analysis, and animation [M];Journal of Visualization and Computer Animation; 1990年
3Eisert P, Girod B; Analyzing facial expressions for virtual conferencing [M];IEEE Computer Graphics and Applications; 1998年
4Posdamer J, Altschuler M; Surface measurement by spaceencoded projected beam systems [M];Computer Graphics and Image Processing; 1982年
5Gourret J P, Khamlichi J; A model for compression and classification of face data structures [M];Computer & Graphics; 1996年
6Lavagetto F, Pockaj R; The facial animation engine: Toward a high-level interface for the design of MPEG-4 compliant animated faces [M];IEEE Trans on Circuits and Systems for Video Technology; 1999年
7Burt P J, Andelson EH; A multiresolution spline with application to image mosaics [M];ACM Transactions on Graphics; 1983年
8Coquillart S; Extended free-form deformation: a sculpturing tool for 3D geometric modeling [M];Computer Graphics; 1990年
9Boyer K L, Kak A C; Color-encoded structured light for rapid active ranging [M];IEEE Transactions on Pattern Analysis and Machine Intelligence; 1987年
10Liu L, Wang G; Explicit matrix representation for NURBS curves and surfaces [M];Computer Aided Geometric Design; 2002年
 【相似文献】 
 中国期刊全文数据库
 
1周东生,张强,魏小鹏; 人脸动画中语音可视化算法研究进展 [J];计算机工程与应用; 2007年09期; 40-43
2陈新,周东生,张强,魏小鹏; 语音驱动人脸动画中语音参数的提取技术 [J];计算机工程; 2007年06期; 231-233+241
3姜大龙,王兆其,高文; 基于MPEG-4的三维人脸动画实现方法 [J];系统仿真学报; 2001年S2期; 497-500+505
4吴渊,郑文庭; 一种参数化的表情映射方法 [J];计算机应用研究; 2004年10期; 121-123+125
5陈益强,高文,王兆其,姜大龙; 基于机器学习的语音驱动人脸动画方法 [J];软件学报; 2003年02期; 58-64
6徐先良,沈萦华,费广正,石民勇; 计算机人脸建模和动画技术综述 [J];北京广播学院学报(自然科学版); 2005年01期; 12-20
7宋阳,刘胜兰,张燕宏; 利用SAPI5完成中文语音音素的分解 [J];微计算机信息; 2005年03期; 234-235+31
8张亚妮; 基于MPEG-4的人脸动画技术研究 [J];计算机应用与软件; 2003年09期; 62-63+83
9王奎武,王洵,董兰芳,陈意云; 一个MPEG-4兼容的人脸动画系统 [J];计算机研究与发展; 2001年05期; 18-24
10姜大龙,高文,王兆其,陈益强; 面向纹理特征的真实感三维人脸动画方法 [J];计算机学报; 2004年06期; 31-38
 中国优秀硕士学位论文全文数据库
 
1陈亚勇; 基于文字驱动的人脸动画及其人脸模型的快速重建 [D];浙江大学; 2002年
2邹自强; 基于MPEG-4的人脸建模和人脸动画 [D];北京工业大学; 2003年
3陈通波; 人脸跟踪和任意光照下的人脸动画 [D];北京工业大学; 2002年
4吕江波; MPEG-4兼容的人脸语音动画系统及其在网络通信中的应用 [D];浙江大学; 2003年
5谢培树; 基于形变褶皱合成的逼真人脸动画 [D];南京信息工程大学; 2006年
6高益茂; 三维逼真人脸动画方法研究与实现 [D];江苏大学; 2005年
7徐胜; 基于智能麦克风阵列的说话人跟踪技术 [D];电子科技大学; 2004年
8杨耿国; 基于多层结构物理模型的三维人脸动画研究 [D];山东大学; 2005年
9曹鹏; 语音情感识别技术的研究与实现 [D];江苏大学; 2005年
10陈鲁; 用于人脸识别的三维人脸模型重建 [D];上海交通大学; 2007年
 中国博士学位论文全文数据库
 
1胡永利; 真实感三维人脸建模及应用研究 [D];北京工业大学; 2004年
2陈益强; 基于数据挖掘的虚拟人多模式行为合成研究 [D];中国科学院研究生院(计算技术研究所); 2003年
3姜大龙; 真实感三维人脸合成方法研究 [D];中国科学院研究生院(计算技术研究所); 2005年
 中国重要会议论文全文数据库
 
1王奎武,王洵,董兰芳,陈意云; 一个MPEG-4兼容的人脸动画系统 [A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集 [C]; 2001年
2吴渊,潘永娟,郑文庭; 参数化的表情映射 [A];第一届中国情感计算及智能交互学术会议论文集 [C]; 2003年
3卢化,岳东剑,柴佩琪; 在微机上运行的T6668语音合成系统 [A];第三届全国人机语音通讯学术会议论文集 [C]; 1994年
4柳杨华,徐光祐; 一种实现姿态可变逼真人脸动画的模型 [A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集 [C]; 2005年
5 哈尔滨工业大学语音处理研究室简介 [A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编 [C]; 2006年
6陈韬,李昌立,莫福源; 汉语孤立字全音节实时识别系统 [A];第一届全国语言识别学术报告与展示会论文集 [C]; 1990年
7薛啸宇,柳玉昌,赵金龙; 基于语音识别的计算机声图系统 [A];第一届全国语言识别学术报告与展示会论文集 [C]; 1990年
8刘晓星,韩疆,邵建,颜永红; 互联网音频智能检索系统设计 [A];全国网络与信息安全技术研讨会'2005论文集(下册) [C]; 2005年
 中国重要报纸全文数据库
 
1王玮 蔡莲红; 数据挖掘走入语音处理 [N];计算机世界; 2001年
2中国科学院自动化研究所模式识别国家重点实验室 辛乐陶建华; 说话人头像技术:让语音可视 [N];计算机世界; 2007年
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)