收藏本站
《计算机工程与设计》 2007年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种自组织的汉语组合型歧义消歧方法

冯素琴  陈惠明  
【摘要】:组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭配统计表的多元最大对数似然比进行消歧;继而根据实验确定了歧义字段的上下文窗口、窗口位置区分、权值估计等要素;在此基础上采用自组织方法自动扩充搭配集,使消歧信息趋于稳定;最后,对提出的方法进行了实验,实验表明,该算法能有效提高消歧准确率。

【引证文献】
中国硕士学位论文全文数据库 前1条
1 程冲;信息检索用汉语分词与未登录词识别技术研究[D];南京农业大学;2007年
【参考文献】
中国期刊全文数据库 前5条
1 肖云,孙茂松,邹嘉彦;利用上下文信息解决汉语自动分词中的组合型歧义[J];计算机工程与应用;2001年19期
2 谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期
3 郑德权,于凤,王开涛 ,赵铁军;基于汉语二字应成词的歧义字段切分方法[J];计算机工程与应用;2003年01期
4 苏菲,王丹力,戴国忠;基于标记的规则统计模型与未登录词识别算法[J];计算机工程与应用;2004年15期
5 曾华琳,李堂秋,史晓东;一种基于提取上下文信息的分词算法[J];计算机应用;2005年09期
中国重要会议论文全文数据库 前1条
1 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【共引文献】
中国期刊全文数据库 前10条
1 赵成龙,薛欣;基于WEB的智能答疑系统的设计与实现[J];安阳师范学院学报;2004年02期
2 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
3 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
4 冯素琴;陈惠明;;利用上下文信息解决汉语组合型歧义[J];电脑开发与应用;2007年01期
5 刘禹孜,何中市;一种基于SVM和规则消除组合型歧义的算法[J];重庆大学学报(自然科学版);2005年10期
6 瞿锋;陈纪元;;汉语自动分词算法综述[J];福建电脑;2006年04期
7 翟凤文;赫枫龄;左万利;;基于统计规则的交集型歧义处理方法[J];吉林大学学报(理学版);2006年02期
8 路永刚;赵伟;;一种改进的MM分词方法的研究与实现[J];长春工业大学学报(自然科学版);2006年04期
9 肖云,孙茂松,邹嘉彦;利用上下文信息解决汉语自动分词中的组合型歧义[J];计算机工程与应用;2001年19期
10 张素娟,郑庆华,胡云华,孙霞;一种面向网络答疑的汉语切分歧义消除算法[J];计算机工程与应用;2004年25期
中国重要会议论文全文数据库 前2条
1 陶建华;蔡莲红;赵晟;;汉语语音合成中的文本分析和韵律处理[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
2 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
3 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
6 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
7 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
8 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 魏进;中文分词技术在公安信息系统中的应用研究[D];解放军信息工程大学;2007年
2 程冲;信息检索用汉语分词与未登录词识别技术研究[D];南京农业大学;2007年
3 曹洁;基于案例推理的数据挖掘算法搜索策略的研究[D];太原理工大学;2007年
4 潘景剑;具有中文人名识别功能的汉语自动分词算法研究[D];河北工业大学;2006年
5 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
6 皮鹏;智能搜索引擎系统的研究[D];哈尔滨工程大学;2002年
7 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
8 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
9 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
10 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期
4 冯素琴;陈惠明;;利用上下文信息解决汉语组合型歧义[J];电脑开发与应用;2007年01期
5 卢微;;隐马尔可夫模型在自然语言理解研究中的应用[J];电脑与信息技术;2007年01期
6 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
7 马光志,李专;基于特征词的自动分词研究[J];华中科技大学学报(自然科学版);2003年03期
8 翟凤文;赫枫龄;左万利;;基于统计规则的交集型歧义处理方法[J];吉林大学学报(理学版);2006年02期
9 苏菲,王丹力,戴国忠;基于标记的规则统计模型与未登录词识别算法[J];计算机工程与应用;2004年15期
10 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
中国硕士学位论文全文数据库 前2条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 张俊;基于内容的汉语文献信息检索系统的设计与实现[D];南京农业大学;2006年
【二级参考文献】
中国期刊全文数据库 前5条
1 孙茂松,左正平,邹嘉彦;高频最大交集型歧义切分字段在汉语自动分词中的作用[J];中文信息学报;1999年01期
2 许嘉璐;现状和设想——试论中文信息处理与现代汉语研究[J];中文信息学报;2001年02期
3 刘挺,吴岩,王开铸;最大概率分词问题及其解法[J];哈尔滨工业大学学报;1998年06期
4 黄昌宁;统计语言模型能做什么?[J];语言文字应用;2002年01期
5 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
中国重要会议论文全文数据库 前1条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 耿立大;;自然语言信息加工和人工智能[J];情报科学;1983年04期
2 爱德华·A德格里戈略;叶自健;;适用于潜艇作战指挥环境的基于知识的系统——用自然语言对话的人/机系统指挥控制[J];火力与指挥控制;1983年04期
3 钱锋;;计算机科学与机器翻译的相互影响[J];计算机科学;1983年03期
4 DavidL·Waltz ,高翔;帮助计算机理解自然语言[J];计算机工程与设计;1986年02期
5 刘涌泉;;中国计算机和自然语言处理的新进展[J];情报科学;1987年01期
6 王广义;发展我国语言工程产业的纽带——中文信息学会自然语言处理专业委员会简介[J];中文信息学报;1988年02期
7 张潮生;格语法与自然语言处理[J];中文信息学报;1988年04期
8 贺广明;;自然语言处理的六个级别[J];情报杂志;1988年04期
9 ;1989年自然语言处理学术研讨会纪要[J];中文信息学报;1989年03期
10 陈震杰;闵珍晖;夏振华;;自然语言处理中的逻辑文法[J];计算机科学;1989年04期
中国重要会议论文全文数据库 前10条
1 林耀燊;李文捷;黄绵辉;;信息检索系统中的自然语言处理[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
2 汪华峰;陈峪;;汉语自然语言理解中词切分中新词问题初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
3 马颖华;苏贵洋;;基于概念的自然语言处理[A];第一届学生计算语言学研讨会论文集[C];2002年
4 许勇;宋柔;;基于百科词典的知识获取系统的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
5 刘功申;胡佩华;岳奕;王永成;;偏重摘要及其实现技术[A];第一届学生计算语言学研讨会论文集[C];2002年
6 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
7 李生;;哈工大自然语言处理研究进展[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 马金山;刘挺;李生;;基于n-gram及依存分析的中文自动查错方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
9 郑泽之;张普;杨建国;;基于语料库的字母词语自动提取研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 军涛;跨越语言障碍沟通无疆界[N];科技日报;2000年
2 TurboCRM咨询总监 李蓓;知识管理会成为CRM的基石吗[N];中国计算机报;2001年
3 本报记者 叶武滨;能看会想 能听会讲[N];人民邮电;2001年
4 康乐;漫谈搜索引擎技术[N];中国化工报;2002年
5 樊永梅 编译;CRM成就自助服务[N];计算机世界;2002年
6 本报记者 顾洪文;TRS:内容管理 创造价值[N];计算机世界;2002年
7 ;开天辟地第一回[N];计算机世界;2002年
8 ;从CRM到KRM[N];上海金融报;2002年
9 ;IBM将AI引入非结构化数据存储[N];中国计算机报;2003年
10 郑惠荣;利用人工智能进行邮件过滤[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
5 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
6 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
7 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
8 刘根辉;计算语用学基础理论及其应用研究[D];华中科技大学;2005年
9 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
10 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
2 詹思瑜;自然语言的计算机处理模型[D];电子科技大学;2003年
3 陈波;中文统计自然语言处理隐马模型的研究[D];重庆大学;2003年
4 李珊;远程教学中自动答疑系统的研究[D];河海大学;2004年
5 程晓静;自然语言处理在药物专利检索系统中的应用[D];大连理工大学;2004年
6 李力;利用知网进行(计算机)自然语言处理[D];电子科技大学;2004年
7 史瑞耘;论机器翻译的语义分析方法[D];哈尔滨工程大学;2004年
8 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
9 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
10 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026