收藏本站
《福建电脑》 2011年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于分隔符的中文论坛信息抽取

魏晶晶  于然  廖祥文  
【摘要】:论坛蕴含丰富的信息资源,如何获取并结构化这些信息被广泛研究。目前有多种信息抽取方法,但因各种方法的处理对象不同,以及中文论坛独有的特点,使得通用抽取方法应用于中文论坛信息抽取并不能取得理想的效果。因此本文在信息抽取方法softmealy的基础上,对中文论坛的特性进行分析,提出基于分隔符的中文论坛信息抽取方法,并以3个被广泛使用的中文论坛数据进行实验。实验结果表明,本方法可取得良好效果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期
2 王全剑;李芳;;基于Wikipedia的人名简历信息抽取[J];计算机应用与软件;2011年07期
3 黄湖岗;;Acess数据库在学校信息交流平台设计与实现中的应用[J];景德镇高专学报;2011年02期
4 孙全红;张贞贞;;基于树结构的Web表格信息抽取方法[J];华北水利水电学院学报;2011年03期
5 钱程;阳小兰;;HTML到XML转换研究[J];计算机与现代化;2011年08期
6 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
7 ;IPDPS 2012 PhD Forum(博士生论坛)论文征集[J];计算机工程与设计;2011年09期
8 周严英;;基于asp+access的工作论坛开发[J];广东水利电力职业技术学院学报;2011年03期
9 梁吉光;田俊华;熊玲;;基于二阶HMM的信息抽取研究[J];情报杂志;2011年07期
10 ;读编往来[J];电脑爱好者;2011年05期
11 ;读编往来[J];电脑爱好者;2011年06期
12 孙中友;李培峰;朱巧明;;事件信息抽取中的数据预处理方法研究[J];计算机应用与软件;2011年08期
13 ;宝信召开IT运维服务论坛[J];现代制造;2010年41期
14 ;金兔迎春,CFan论坛图区网友拜大年[J];电脑爱好者;2011年03期
15 常政;;可量化的软件价值——记2010年IBM Rational软件创新论坛[J];程序员;2010年11期
16 刘鑫;;圆桌论坛:UML真体验 有限使用UML[J];程序员;2010年08期
17 ;企业分销管理信息化高峰论坛珠海召开[J];信息与电脑;2011年08期
18 高松;;移动开发淘金有道——TUP三期主题论坛报道[J];程序员;2010年09期
19 吴忠仪;;密码存云端 安全更方便[J];电脑爱好者;2011年04期
20 赵小明;朱洪波;陈黎;王亚强;秦湘清;于中华;;基于多分类器的金融领域多元关系信息抽取算法[J];计算机工程与设计;2011年07期
中国重要会议论文全文数据库 前10条
1 李昕;朱永盛 ;武港山;;论坛消息语义结构的提取与分析[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
5 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 孟红;钟华;;基于htmlparser的搜索引擎信息抽取系统设计与实现[A];第六届全国信息检索学术会议论文集[C];2010年
8 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 文晓阳;高能;荆继武;;论坛验证码技术的安全性分析[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
10 郭宏蕾;郭志立;;基于模型组合训练机制的特定领域名词性实体识别[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
4 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
5 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
6 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
7 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
8 王菁华;文本中知识的获取[D];北京邮电大学;2008年
9 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
10 李晗静;基于自然语言处理的空间概念建模研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
3 郭力;Web正文信息抽取与面向层次结构的分类技术研究[D];华南理工大学;2011年
4 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
5 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
6 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
7 田宇;基于XML的WEB信息抽取系统研究与实现[D];内蒙古大学;2011年
8 杨选选;基于概念图和语义角色的多领域信息抽取系统研究[D];西北大学;2010年
9 安增文;垂直搜索中信息属性抽取和分类模型研究与实现[D];中国石油大学;2010年
10 刘艺琴;基于本体的Web非规范知识处理中信息抽取技术研究[D];昆明理工大学;2005年
中国重要报纸全文数据库 前2条
1 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
2 希安;微软试水信息检索[N];经济日报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978