收藏本站
《中文信息学报》 2012年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文维基百科的结构化信息抽取及词语相关度计算方法

涂新辉  张红春  周琨峰  何婷婷  
【摘要】:维基百科作为一个以开放和用户协作编辑为特点的Web 2.0知识库系统,具有知识面覆盖度广,结构化程度高,信息更新速度快等优点。然而,维基百科的官方仅提供一些半结构化的数据文件,很多有用的结构化信息和数据,并不能直接地获取和利用。因此,该文首先从这些数据文件中抽取整理出多种结构化信息;然后,对维基百科中的各种信息建立了对象模型,并提供了一套开放的应用程序接口,大大降低了利用维基百科信息的难度;最后,利用维基百科中获取的信息,该文提出了一种基于链接所对应主题页面所属类别的词语语义相关度计算方法。

【参考文献】
中国博士学位论文全文数据库 前1条
1 李赟;基于中文维基百科的语义知识挖掘相关研究[D];北京邮电大学;2009年
【共引文献】
中国重要会议论文全文数据库 前1条
1 张红春;何婷婷;涂新辉;周琨峰;;中文维基百科的结构化信息抽取及词语相关度计算[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国硕士学位论文全文数据库 前2条
1 汪祥;基于中文维基百科的语义相关度计算的研究与实现[D];国防科学技术大学;2011年
2 伍成志;基于维基百科的知识查找系统的研究与实现[D];华南理工大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 郑家恒,钱揖丽,李竞;二字词词义组合推理方法的研究[J];中文信息学报;2001年06期
2 王文钧;李巍;;垂直搜索引擎的现状与发展探究[J];情报科学;2010年03期
3 裘江南;李丽冬;吴力文;;客观知识体系中的相关性研究[J];情报学报;2009年03期
4 聂卉;龙朝晖;;结合语义相似度与相关度的概念扩展[J];情报学报;2007年05期
5 裘江南;罗志成;叶鑫;;语义相关度算法在主题抽取中的适用性研究[J];情报学报;2009年01期
6 李赟;黄开妍;任福继;钟义信;;维基百科的中文语义相关词获取及相关度分析计算[J];北京邮电大学学报;2009年03期
7 赵应秋;罗军;张君艳;;基于知网的词语语义相关度计算[J];信息技术;2010年03期
8 王红玲;吕强;徐瑞;;中文语义相关度计算模型研究[J];计算机工程与应用;2009年07期
9 李楠;王晓博;刘超;;自动分析软件缺陷报告间相关性的方法研究[J];计算机应用研究;2010年06期
10 刘军;姚天昉;;基于Wikipedia的语义相关度计算[J];计算机工程;2010年19期
中国重要会议论文全文数据库 前7条
1 田萱;杜小勇;李海华;;一种基于语义关系计算领域本体中概念间语义相关度的方法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 张红春;何婷婷;涂新辉;周琨峰;;中文维基百科的结构化信息抽取及词语相关度计算[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 吴晨;张全;;基于HNC的自然语言问答处理系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 张运良;张全;;概念优先组合判断研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 左万利;王英;高金;赵静宇;邵慧勇;;基于本体的语义查询优化[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 张杨;房斌;徐传运;;基于本体和描述逻辑的图像语义识别[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国重要报纸全文数据库 前10条
1 ;W3C大力推进XML测试[N];计算机世界;2002年
2 韦升阳;ECM:在业务系统中提炼信息[N];中国计算机报;2003年
3 海波龙公司中国区董事总经理 曹建静;BI从部门为中心到企业为中心[N];计算机世界;2004年
4 胡金喜;搜索引擎如何搜到用户心?[N];中华工商时报;2000年
5 本报记者 李建平综合外电报道;网络服务的新突破?[N];计算机世界;2003年
6 李军;Interwoven化整为零[N];中国计算机报;2004年
7 乔哲;定义信息高效管理[N];国际商报;2001年
8 本报记者 周锦鸾;高效管理 非结构化信息[N];中国计算机报;2001年
9 本报记者 学武;国信贝斯定义信息高效管理[N];中国财经报;2001年
10 ;MSR:在光纤上跳舞[N];网络世界;2004年
中国博士学位论文全文数据库 前6条
1 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
2 赵英海;基于内容的多媒体视觉信息搜索研究[D];中国科学技术大学;2010年
3 吴超;在线社会化网络的语义分析和语义社会网的构建[D];浙江大学;2010年
4 王琦;古代壁画的语义检索技术及应用研究[D];浙江大学;2011年
5 生佳根;基于本体的知识获取、管理和应用方法研究[D];南京航空航天大学;2012年
6 李新;面向神经计算的视觉信息处理研究[D];西北工业大学;2002年
中国硕士学位论文全文数据库 前10条
1 汪祥;基于中文维基百科的语义相关度计算的研究与实现[D];国防科学技术大学;2011年
2 肖江涛;基于本体的语义相关度算法研究[D];国防科学技术大学;2010年
3 张功亮;基于领域本体的Web语义信息检索研究[D];广西师范大学;2011年
4 伍成志;基于维基百科的知识查找系统的研究与实现[D];华南理工大学;2012年
5 陈旭;政务信息资源目录服务检索技术的研究与实现[D];东华大学;2011年
6 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
7 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
8 徐彩娜;基于本体推理的Web服务匹配研究[D];中国海洋大学;2007年
9 李丽冬;主题图的语义相关度评价方法研究[D];大连理工大学;2008年
10 王海东;基于树核的代词消解研究[D];苏州大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026