收藏本站
《计算机应用》 2014年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于弱监督的属性关系抽取方法

杨宇飞  戴齐  贾真  尹红风  
【摘要】:针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科条目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语料;最后,基于条件随机场(CRF)建立属性关系抽取模型。在互动百科中采集的数据集上进行实验,综合评价F值达到了80.9%。结果表明该方法能够获得质量较高的训练语料,并取得良好的抽取性能。

【参考文献】
中国期刊全文数据库 前2条
1 李艳翠;冯文贺;周国栋;朱坤华;;基于逗号的汉语子句识别研究[J];北京大学学报(自然科学版);2013年01期
2 郭剑毅;李真;余正涛;张志坤;;领域本体概念实例、属性和属性值的抽取及关系预测[J];南京大学学报(自然科学版);2012年04期
【共引文献】
中国期刊全文数据库 前4条
1 陈立玮;冯岩松;赵东岩;;基于弱监督学习的海量网络数据关系抽取[J];计算机研究与发展;2013年09期
2 冯文贺;;汉英篇章结构平行语料库的对齐标注研究[J];中文信息学报;2013年06期
3 虞为;陈俊鹏;;基于MapReduce的书目数据关联匹配研究[J];现代图书情报技术;2013年09期
4 于彤;陈华钧;李敬华;;中医药语义维基系统研发[J];中国医学创新;2013年34期
中国博士学位论文全文数据库 前2条
1 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年
2 唐富年;面向语义正确性的集成数据访问方法研究[D];国防科学技术大学;2012年
中国硕士学位论文全文数据库 前6条
1 杨婧;基于概念图的可视属性语义网构建的研究[D];西北大学;2013年
2 李博;基于语义关系的高血压临床指南知识库构建[D];电子科技大学;2013年
3 李真;受限域实体语义关系抽取研究[D];昆明理工大学;2013年
4 项灵辉;基于图数据库的海量RDF数据分布式存储[D];武汉科技大学;2013年
5 罗超;基于中文自然语言的合理用药查询[D];武汉科技大学;2013年
6 生兆花;大规模生物医学语义关联数据集的查询关键技术研究[D];天津大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 储泽祥;;小句是汉语语法基本的动态单位[J];汉语学报;2004年02期
2 王文格;;现代汉语小句的研究现状及存在的问题[J];汉语学习;2010年01期
3 黄河燕,陈肇雄;基于多策略分析的复杂长句翻译处理算法[J];中文信息学报;2002年03期
4 李幸;宗成庆;;引入标点处理的层次化汉语长句句法分析方法[J];中文信息学报;2006年04期
5 郭剑毅;薛征山;余正涛;张志坤;张宜浩;姚贤明;;基于层叠条件随机场的旅游领域命名实体识别[J];中文信息学报;2009年05期
6 康为;穗志方;;基于Web弱指导的本体概念实例及属性的同步提取[J];中文信息学报;2010年01期
7 耿焕同;蔡庆生;于琨;赵鹏;;一种基于词共现图的文档主题词自动抽取方法[J];南京大学学报(自然科学版);2006年02期
8 廖士中;丁立中;贾磊;;支持向量回归多参数的同时调节[J];南京大学学报(自然科学版);2009年05期
9 耿骞;耿崇;;利用词语共现进行Ontology的概念获取[J];现代图书情报技术;2006年02期
10 邢福义;;小句中枢说[J];中国语文;1995年06期
【相似文献】
中国期刊全文数据库 前10条
1 沈勤中;周国栋;朱巧明;孔芳;丁金涛;;基于字位置概率特征的条件随机场中文分词方法[J];苏州大学学报(自然科学版);2008年03期
2 刘海鹏;王小捷;;基于条件随机场和知识库的手机短信命名实体识别[J];广西师范大学学报(自然科学版);2009年01期
3 葛金虎;;基于条件随机场的中文命名实体识别的研究[J];科技信息;2010年16期
4 迟呈英;于长远;战学刚;;基于条件随机场的中文分词方法[J];情报杂志;2008年05期
5 贾美英;杨炳儒;郑德权;杨靖;;采用CRF技术的军事情报术语自动抽取研究[J];计算机工程与应用;2009年32期
6 许晓丽;卢志茂;张格森;;基于条件随机场的中文命名实体识别研究[J];中国新技术新产品;2009年02期
7 刘豹;张桂平;蔡东风;;基于统计和规则相结合的科技术语自动抽取研究[J];计算机工程与应用;2008年23期
8 阴晋岭;王惠临;;词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J];现代图书情报技术;2009年03期
9 张朝胜;郭剑毅;线岩团;余正涛;雷春雅;王海雄;;基于条件随机场的英文产品命名实体识别[J];计算机工程与科学;2010年06期
10 乔长兵;;基于条件随机场的分词工作流研究与应用[J];微处理机;2010年03期
中国重要会议论文全文数据库 前10条
1 代翠;周俏丽;蔡东风;;统计和规则相结合的汉语最长名词短语自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 宁伟;蔡东风;季铎;;基于条件随机场的冠词选择研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 何赛克;王小捷;董远;张韬政;白雪;;归一化的邻接类别方法在基于条件随机场的中文分词中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 张祝玉;任飞亮;朱靖波;;基于条件随机场的中文命名实体识别特征比较研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 陈奇哲;刘全升;姚天昉;;汉语意见型语句主题与情感关系抽取的研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
2 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
3 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
4 孙承杰;基于判别式模型的生物医学文本挖掘相关问题研究[D];哈尔滨工业大学;2008年
5 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
6 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
7 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
8 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
9 瞿仰;基于声调识别的汉语计算机辅助学习系统研究[D];华东师范大学;2012年
10 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
中国硕士学位论文全文数据库 前10条
1 章剑锋;评论挖掘中的语义信息抽取[D];复旦大学;2008年
2 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
3 刘海鹏;面向手机短信的命名实体识别研究[D];北京邮电大学;2009年
4 刘磊;面向专利的双语术语自动抽取技术的研究[D];沈阳航空工业学院;2009年
5 何楠;基于统计机器学习的两阶段中文命名实体识别研究[D];北京邮电大学;2008年
6 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
7 代翠;汉语最长名词短语的自动识别与分析[D];沈阳航空工业学院;2009年
8 徐波;基于条件随机场的口语规范化处理研究[D];南京理工大学;2009年
9 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
10 张志田;无监督关系抽取方法研究[D];哈尔滨工业大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026