收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

从搭配知识获取最优种子的词义消歧方法

全昌勤  何婷婷  姬东鸿  刘辉  
【摘要】:基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词 ,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识 ,但人工获取质量较好的初始搭配是比较困难的 ,并且无法保证有效的扩大搭配知识。针对该问题 ,提出了通过机器学习初始搭配实例获取最优种子 ,再由最优种子扩增更多指示词 ,最后利用这些指示词实现具有多个义项的多义词消歧。采用该方法对 8个多义词进行消歧的测试实验中取得了 87 7%的平均正确率。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王晋;孙涌;王璁玮;;基于领域本体的文本相似度算法[J];苏州大学学报(工科版);2011年03期
2 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
4 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 何径舟;王厚峰;;基于特征自动选取的汉语词义消歧[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 王菁华;刘建毅;王枞;;语义网络结构下的词义消歧[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
9 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 郭宇航;车万翔;刘挺;;基于语言模型验证的词义消歧语料获取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
3 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
4 王菁华;文本中知识的获取[D];北京邮电大学;2008年
5 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
6 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
7 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
8 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
9 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
10 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
2 詹靓雯;基于知网的中文词义消歧研究[D];中国计量学院;2012年
3 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
4 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
5 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
6 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
7 徐赟;基于知网和贝叶斯模型的词义消岐技术的研究[D];南京理工大学;2010年
8 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
9 汤小娜;词义消歧在统计机器翻译中的应用研究[D];厦门大学;2007年
10 杨宇娜;基于统计的中文词义消歧技术研究[D];哈尔滨工业大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978