收藏本站
《计算机工程与应用》 2004年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于语料库的关联词识别方法

李文翔  晏蒲柳  张滨  夏德麟  
【摘要】:关联词语的出现在汉语文章中占有很大的比重,它们可以在复句分析中起到非常重要的作用。该文主要讨论如何在语料库中提取反映关联词语用法的各种特征信息,再通过数据挖掘算法将这些信息整理为关联词语的知识库,作为关联词识别的依据,并对有歧义的关联词语提出了基于决策树的消歧方法。最后,通过开放测试证明了该方法的有效性。

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 黄建年;侯汉清;;农业古籍断句标点模式研究[J];中文信息学报;2008年04期
中国博士学位论文全文数据库 前1条
1 舒江波;面向中文信息处理的复句关系词自动标识研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前3条
1 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
2 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年
3 李培培;基于语料库的逆转态语气副词研究[D];河北大学;2008年
【参考文献】
中国期刊全文数据库 前1条
1 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
【共引文献】
中国期刊全文数据库 前10条
1 耿增民;刘万春;朱玉文;;受限领域的自动文摘方法研究[J];北京理工大学学报;2006年08期
2 李六杏;区凤霞;;基于最优属性约简的中文邮件过滤系统[J];电脑知识与技术(学术交流);2007年05期
3 魏晓宁;;基于隐马尔科夫模型的中文分词研究[J];电脑知识与技术(学术交流);2007年21期
4 张磊;张代远;;中文分词算法解析[J];电脑知识与技术;2009年01期
5 陈文君;於文雪;;汉英跨语言检索系统中关键词提取方法的研究[J];电脑知识与技术;2009年28期
6 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
7 冯永;贺迅;唐黎;陈显勇;陈贞;;面向文本知识管理的自适应中文分词算法[J];重庆大学学报;2010年10期
8 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
9 刘延华;林嘉雯;;基于贝叶斯算法的中文邮件过滤系统设计[J];福建电脑;2009年11期
10 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;基于Web挖掘自动分类器的设计与实现[J];广西科学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
2 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
3 邓攀;刘功申;;基于标引信息的网络新概念发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
5 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 林小俊;田浩;王馨浩;杜蕴璇;许敏;吴玺宏;迟惠生;;语言模型训练语料处理方法及解码词典的设计[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 何中军;刘群;林守勋;;统计机器翻译中短语切分的新方法[A];第三届学生计算语言学研讨会论文集[C];2006年
8 陈晓苏;邹园斌;张文珂;;全切分图与路径表达式在分词算法中的应用[A];第三届学生计算语言学研讨会论文集[C];2006年
9 朱鉴;张建;李淼;强静;杨攀;;面向民族语言信息处理的汉语分词方法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
10 文捷;汪卫;王轶彤;;ECMail:基于实体发现、查找和管理的中文邮件管理系统[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘运通;产品设计过程知识配送服务关键技术研究[D];浙江大学;2011年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
4 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
5 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
6 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
7 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
8 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
9 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
10 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
3 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
4 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
5 常富国;高技术虚拟企业谈判支持问题处理系统研究[D];哈尔滨理工大学;2010年
6 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
7 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
8 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年
9 李长进;基于中文带权关键词树的受限领域问答系统研究[D];山东经济学院;2011年
10 林冬盛;中文分词算法的研究与实现[D];西北大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 夏年喜;;逻辑学、语言学与信息科学——论自然语言逻辑的学科性质[J];安徽大学学报;2006年02期
2 周有斌;“不是A,就是B”句表述对象的数量及作用[J];安徽教育学院学报;2002年01期
3 李国庆;现代汉语的“不是P,也是Q”复句[J];安徽教育学院学报;2002年05期
4 彭小川;论副词“倒”的语篇功能——兼论对外汉语语篇教学[J];北京大学学报(哲学社会科学版);1999年05期
5 周守晋;“主观量”的语义信息特征与“就”、“才”的语义[J];北京大学学报(哲学社会科学版);2004年03期
6 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
7 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
8 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
9 袁毓林;句子的焦点结构及其对语义解释的影响[J];当代语言学;2003年04期
10 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
中国博士学位论文全文数据库 前7条
1 朱斌;现代汉语“是”字句然否类型联结研究[D];华中师范大学;2002年
2 曾常年;现代汉语因果句群研究[D];华中师范大学;2003年
3 齐春红;现代汉语语气副词研究[D];华中师范大学;2006年
4 姚双云;复句关系标记的搭配研究与相关解释[D];华中师范大学;2006年
5 罗进军;有标假设复句研究[D];华中师范大学;2007年
6 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
7 尹蔚;多维视域下的有标选择复句研究[D];华中师范大学;2008年
中国硕士学位论文全文数据库 前10条
1 方红;“侥幸”类语气副词研究[D];上海师范大学;2003年
2 郭新雨;现代汉语语气副词研究[D];天津师范大学;2003年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 罗小虎;基于蚁群算法的汉语自动分词的研究与实现[D];苏州大学;2004年
5 刘冬;料定类语气副词研究[D];上海师范大学;2005年
6 姚杰;或然类语气副词研究[D];上海师范大学;2005年
7 郑晓雷;领悟类语气副词研究[D];上海师范大学;2005年
8 肖元珍;限选式“不是A,就是B”分析[D];暨南大学;2005年
9 晁代金;“巧合”类语气副词研究[D];广西师范大学;2005年
10 陈熹;面向对外汉语的几组语气副词的研究[D];华中科技大学;2005年
【二级引证文献】
中国期刊全文数据库 前6条
1 胡金柱;陈江曼;杨进才;舒江波;雷利利;;基于规则的连用关系标记的自动标识研究[J];计算机科学;2012年07期
2 常娥;黄建年;侯汉清;;古籍智能整理与开发系统构建研究[J];情报资料工作;2009年04期
3 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
4 张开旭;夏云庆;宇航;;基于条件随机场的古文自动断句与标点方法[J];清华大学学报(自然科学版)网络.预览;2009年10期
5 吴慰慈;谷秀洁;;2008年国内图书馆学学术进展[J];图书馆论坛;2009年06期
6 赵阳;顾磊;;基于中文信息处理的古籍整理研究评述[J];图书情报工作;2010年03期
中国博士学位论文全文数据库 前1条
1 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
中国硕士学位论文全文数据库 前4条
1 徐晨霞;基于知网的多关键字检索研究[D];重庆大学;2008年
2 管士学;基于词语相关度的搜索引擎排序算法[D];兰州大学;2012年
3 雷利利;复句关系词自动标识系统中规则解析器的研究[D];华中师范大学;2012年
4 陈江曼;复句关系词自动标识系统中规则库及其维护方法研究[D];华中师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前2条
1 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
2 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
【相似文献】
中国期刊全文数据库 前10条
1 王永生;;英汉机器翻译系统中的词性标注研究[J];计算机工程与应用;2010年20期
2 王永生;柴佩琪;;英文文语转换系统中基于决策树的词性标注的非监督学习[J];计算机应用;2006年03期
3 钱揖丽;荀恩东;;基于分类回归树CART的汉语韵律短语边界识别[J];计算机工程与应用;2008年06期
4 石瑛;胡学钢;方磊;;基于决策树的多特征语音情感识别[J];计算机技术与发展;2009年01期
5 刘方舟;周游;;用决策树指导TBL进行多音字消歧[J];计算机工程与应用;2011年12期
6 蔡莲红;崔丹丹;蔡锐;;汉语普通话语音合成语料库TH-CoSS的建设和分析[J];中文信息学报;2007年02期
7 骆嘉伟;决策树在计算机中的存贮与计算[J];益阳师专学报;1998年05期
8 董西国,杨静;基于数据挖掘技术的抽油机泵参调整DSS决策支持系统[J];应用科技;2001年12期
9 王晓国,黄韶坤,朱炜,李启炎;应用C4.5算法构造客户分类决策树的方法[J];计算机工程;2003年14期
10 牛成林,于希宁,李建强;专家系统在电力预测负荷中的应用[J];仪器仪表用户;2005年04期
中国重要会议论文全文数据库 前10条
1 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
3 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
4 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
5 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 田浩;林小俊;吴玺宏;迟惠生;;统计与规则相结合的多音字自动注音方法研究与实现[A];第八届全国人机语音通讯学术会议论文集[C];2005年
7 黄贤军;杨玉芳;吕士楠;;基于CART的韵律短语切分[A];第九届全国人机语音通讯学术会议论文集[C];2007年
8 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
9 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
10 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
中国重要报纸全文数据库 前10条
1 华静;七大诱惑诱发公务员热[N];中国改革报;2006年
2 本报记者 秦志勇 通讯员 温天庆 方海波;和谐—合力 创新—活力 发展—助力 支持—动力[N];人民政协报;2006年
3 本报记者 曹秀娟实习生 李涛;热议省城四个环保话题[N];山西日报;2008年
4 通讯员 卢丹;让节约成为我们的自觉行动[N];中国石油报;2006年
5 陈芝蓉;举棋不定时 试试决策树[N];健康报;2004年
6 何志高;一“枝”一“节”总关情[N];医药经济报;2001年
7 舒伊;复合肥;2005继续辉煌?[N];中华合作时报;2005年
8 记者 洪奕宜 通讯员 粤纪宣;反腐促廉政 亮剑为民生[N];南方日报;2008年
9 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
10 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
中国博士学位论文全文数据库 前10条
1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
2 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 张瑞朋;现代汉语书面语中跨标点句句法关系约束条件的研究[D];北京语言大学;2007年
5 王青;基于语料库的《尤利西斯》汉译本译者风格研究[D];山东大学;2010年
6 黄平牧;中文TTS系统中若干关键技术研究[D];北京邮电大学;2008年
7 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年
8 王丽;基于语料库的中国学习者英语口语中语用标记语研究[D];上海交通大学;2008年
9 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年
10 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 齐悦;汉语作为对泰二语教学中的条件关联词偏误及对策研究[D];广西师范大学;2012年
2 朱华;泰国学生关联词习得偏误分析及教学刍议[D];暨南大学;2011年
3 刘亚斌;汉语自然口语的韵律分析和自动标注研究[D];中国社会科学院研究生院;2003年
4 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
5 徐琰;基于语料库的ONLY研究[D];大连海事大学;2003年
6 杨丽萍;基于语料库的英语专业大学生议论文限时写作中的四字词块研究[D];江西师范大学;2010年
7 李淼;用先进的语料库工具推进英语教学[D];首都师范大学;2004年
8 李春青;[D];电子科技大学;2004年
9 王蓉;新闻英语的批评性语篇分析[D];上海师范大学;2010年
10 刘鼎甲;连接成分的显化:基于语料库的中英文翻译文本对比[D];燕山大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026