收藏本站
《外语教学与研究》 2002年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

自然语言处理技术的三个里程碑

黄昌宁  张小凤  
【摘要】:半世纪以来自然语言处理 (NLP)研究取得两点重要认识和三大重要成果 ,即认识到 :(1 )对于句法分析 ,基于单一标记的短语结构规则是不充分的 ;(2 )短语结构规则在真实文本中的分布呈现严重扭曲。换言之 ,有限数目的短语结构规则不能覆盖大规模语料中的语法现象。这与原先的预期大相径庭。NLP技术的发展在很大程度上受到这两个事实的影响。从这个意义上说 ,本领域中称得上里程碑式的成果是 :(1 )复杂特征集和合一语法 ;(2 )语言学研究中的词汇主义 ;(3 )语料库方法和统计语言模型。大规模语言知识的开发和自动获取是NLP技术的瓶颈问题。因此 ,语料库建设和统计学理论将成为该领域中的关键课题
【作者单位】微软亚洲研究院 微软亚洲研究院
【分类号】:H087

【引证文献】
中国期刊全文数据库 前5条
1 李良炎,何中市,易勇;基于词联接的语义分析原理及其算法[J];重庆大学学报(自然科学版);2004年08期
2 张克亮;;机器翻译热的冷思考[J];计算机工程与应用;2006年21期
3 曹雁锋,万建成,卢雷;基于二元运算关系的汉语计算语法模型[J];山东大学学报(工学版);2005年01期
4 侯志霞,曹军;自然语言处理的发展概况及前景展望[J];山东外语教学;2003年05期
5 夏家驷,杨绍北;互文性给机器翻译带来的启示[J];中国翻译;2004年03期
中国博士学位论文全文数据库 前5条
1 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
2 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
3 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
4 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
5 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
中国硕士学位论文全文数据库 前10条
1 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
2 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
3 余贞斌;自然语言理解的研究[D];华东师范大学;2005年
4 陈鑫;中文智能搜索引擎[D];四川大学;2004年
5 张俊;基于神经网络的拼音汉字转换[D];南京理工大学;2004年
6 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
7 蒋发群;基于受限汉语描述的需求规约生成系统的研究[D];湘潭大学;2003年
8 邢富坤;基于信息计算的英语易读性研究及IRMS应用系统开发[D];中国人民解放军外国语学院;2007年
9 黄晓洁;自然语言处理技术在对外汉语教学中的应用研究[D];中国人民解放军外国语学院;2007年
10 陈频;中文科技论文文本分类研究[D];厦门大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 刘来旸,瞿有利,樊孝忠;汉语智能输入系统的设计[J];北京理工大学学报;2001年03期
2 亢世勇;《现代汉语新词语信息(电子)词典》的开发与应用[J];辞书研究;2001年02期
3 亢世勇;《现代汉语语法信息词典》的特点与不足[J];辞书研究;2001年06期
4 徐延勇,周献中,井祥鹤,郭忠伟;基于最大熵模型的汉语句子分析[J];电子学报;2003年11期
5 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
6 李良炎,何中市,易勇;基于词联接的语义分析原理及其算法[J];重庆大学学报(自然科学版);2004年08期
7 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
8 蓝庆元,任海波;计算语言学概说[J];桂林师范高等专科学校学报;2001年04期
9 昝红英,俞士汶;CCD及其应用[J];广西师范大学学报(自然科学版);2003年01期
10 郑逢斌,付征叶,乔保军,毋琳;HENU汉语自动分词系统中歧义字段消除算法[J];河南大学学报(自然科学版);2004年04期
中国重要会议论文全文数据库 前2条
1 邢红兵;;面向对外汉语教学的动词用法频率词典[A];对外汉语学习词典学国际研讨会论文集[C];2005年
2 熊文;张玲;;一种基于规则不依赖于分词的中文数量短语的识别[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
3 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
4 张蕾;概念结构及其应用[D];西北工业大学;2001年
5 樊中元;现代汉语一名多量现象研究[D];湖南师范大学;2003年
6 郭忠伟;作战文书自动生成理论及方法研究[D];南京理工大学;2003年
7 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
8 刁晏斌;虚义动词论[D];南开大学;2004年
9 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
10 王仁强;认知视角的汉英词典词类标注实证研究[D];广东外语外贸大学;2006年
中国硕士学位论文全文数据库 前10条
1 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
2 王春霞;基于语料库的离合词研究[D];北京语言文化大学;2001年
3 陈先华;自然语言理解之汉语量词和名词搭配及查错系统[D];电子科技大学;2002年
4 王立霞;现代汉语介词短语边界识别研究[D];北京语言文化大学;2003年
5 崔尔胜;《水浒全传》量词研究[D];广西大学;2003年
6 张少平;基于结构化自然语言的算法规约研究[D];江西师范大学;2003年
7 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
8 李娜;面向作战文书智能处理的电子词典的研究与实现[D];南京理工大学;2003年
9 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
10 李海林;自然语言理解及其在机务信息规范化中的应用[D];南京航空航天大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
2 张长利,赫枫龄,左万利;一种基于后缀数组的无词典分词方法[J];吉林大学学报(理学版);2004年04期
3 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期
4 吴建胜,战学刚,迟呈英;一种基于自动机的分词方法[J];计算机工程与应用;2005年08期
5 赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期
6 张江;基于规则的分词方法[J];计算机与现代化;2005年04期
7 戴汝为;;从工程控制论到综合集成研讨厅体系——纪念钱学森先生归国50周年[J];自然杂志;2005年06期
8 李强;说“很+不V”[J];阿坝师范高等专科学校学报;2002年01期
9 刘风新,王寒光;基于Java技术实现交互式个性化的远程教学系统[J];北京化工大学学报(自然科学版);2003年02期
10 来思平;现代汉语副词“真”和“很”的用法辨析[J];北京科技大学学报(社会科学版);1999年02期
中国博士学位论文全文数据库 前10条
1 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
2 潘文;现代汉语存现句研究[D];复旦大学;2003年
3 周娟;现代汉语动词与动量词组合研究[D];暨南大学;2007年
4 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
5 朱斌;现代汉语“是”字句然否类型联结研究[D];华中师范大学;2002年
6 刘新文;系统Z的量化扩张及其对话语表现理论的处理[D];中国社会科学院研究生院;2002年
7 曾常年;现代汉语因果句群研究[D];华中师范大学;2003年
8 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
9 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
10 姚双云;复句关系标记的搭配研究与相关解释[D];华中师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 白慧;基于产品设计领域的名词短语语义分析[D];西安电子科技大学;2004年
2 张小林;机械产品设计领域的自然语言理解中名词性短语的语义分析[D];西安电子科技大学;2005年
3 刘阳;“隐性小词表+专业小词库”的自动分词技术研究[D];湖南师范大学;2007年
4 周丽萍;程度副词对VP的选择性研究[D];上海师范大学;2003年
5 林娟;现代汉语程度副词修饰动词性成分研究[D];北京大学;2005年
6 王瑜;现代汉语无定度量词与程度副词同现意义研究[D];上海外国语大学;2005年
7 杜晓萍;“很VP”结构理据考察[D];广西师范大学;2006年
8 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
9 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
10 解晶;大学英语四、六级考试和研究生入学考试中阅读理解的对比分析[D];大连海事大学;2001年
【二级引证文献】
中国期刊全文数据库 前5条
1 王挺;麦范金;刘忠;;自然语言处理及其应用前景的研究[J];桂林航天工业高等专科学校学报;2006年04期
2 张秋余;张博;迟宁;;自然语言语义理解在反垃圾邮件中的应用[J];计算机应用;2006年06期
3 李良炎,何中市,易勇;基于词联接的诗词风格评价技术[J];中文信息学报;2005年06期
4 刘茁;英语广告词语的仿拟艺术[J];深圳大学学报(人文社会科学版);2004年04期
5 罗慧慧;;需求分析辅助生成系统的探讨与构建[J];仲恺农业技术学院学报;2006年04期
中国重要会议论文全文数据库 前1条
1 徐忠明;万建成;杨潇;;依存结构到二元组合结构的自动转换研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
中国硕士学位论文全文数据库 前10条
1 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
2 胡晓军;基于自然汉语的数据库查询研究[D];电子科技大学;2006年
3 丁邦旭;基于P2P的分布式中文搜索引擎的应用研究[D];南昌大学;2006年
4 毛婷婷;中文专有名词识别的研究[D];大连理工大学;2006年
5 陈海波;基于自动分词的企业文档搜索引擎设计与实现[D];西北工业大学;2007年
6 乔永波;规则与统计相结合的中文命名实体识别[D];山东大学;2007年
7 胡晓博;面向特定领域的专业搜索引擎的架构与实现方法[D];哈尔滨工程大学;2007年
8 周翰博;俄语军事文本的局部语义分析[D];中国人民解放军外国语学院;2007年
9 黄晓洁;自然语言处理技术在对外汉语教学中的应用研究[D];中国人民解放军外国语学院;2007年
10 徐缓;网络信息监测与封堵技术的研究[D];南昌大学;2007年
【相似文献】
中国重要会议论文全文数据库 前3条
1 刘辉;章宜华;;词典辅助编纂及生成系统的多层C/S结构和数据库[A];中国辞书学会双语词典专业委员会第6届年会暨学术研讨会论文专辑[C];2005年
2 孟遥;黄玉;赵铁军;李生;;一个包含复杂特征的统计英语句法分析模型[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 郭宏蕾;蒋建民;胡岗;;汉日韩-英多语机译系统的通用英语生成器[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前3条
1 孙志农;词汇意义与构式意义的互动关系研究[D];上海外国语大学;2008年
2 杨春雷;HPSG理论中“自己”和量化名词短语的语用解释的约束条件体系[D];上海外国语大学;2008年
3 韩玉国;范畴语法与汉语非连续结构研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前2条
1 董雪松;建立面向信息处理的词汇认知语义分析模型的尝试[D];黑龙江大学;2007年
2 陈翊;从联接理论的角度对汉语动词“跑”的分析[D];上海外国语大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026