收藏本站
《北京交通大学学报》 2010年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

网络舆情中的信息预处理与自动摘要算法

廉捷  刘云  
【摘要】:提出了一套从互联网原始数据中提取有效信息,利用网页模版对这些信息进行格式化整理,并依据网络舆情的特点对正文信息进行自动摘要处理,在自动摘要处理过程中引入倒排索引概念简化了算法复杂度,基于关键词的权重分析保证了算法能够更准确的找到人们关心的信息.测试结果支持了本文提出的算法.

【参考文献】
中国期刊全文数据库 前3条
1 欧健文,董守斌,蔡斌;模板化网页主题信息的提取方法[J];清华大学学报(自然科学版);2005年S1期
2 刘挺,王开铸;自动文摘的四种主要方法[J];情报学报;1999年01期
3 杨建武,陈晓鸥;基于倒排索引的文本相似搜索[J];计算机工程;2005年05期
【共引文献】
中国期刊全文数据库 前10条
1 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期
2 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
3 金博,滕弘飞,史彦军,王丹虹;机辅写作:样本库中写作材料检索方法[J];大连理工大学学报;2002年05期
4 李向阳,陆建江,张亚非;基于竞争分类的Web信息抽取[J];电子学报;2004年11期
5 李向阳;戴江山;张亚非;;一种Web信息抽取规则的优化方法[J];兰州理工大学学报;2006年01期
6 黄丽琼;何中市;;基于统计语义和结构特征的自动文摘[J];广西师范大学学报(自然科学版);2006年04期
7 潘晔;任广伟;舒艳;;利用本体进行Web数据集成[J];贵州工业大学学报(自然科学版);2006年03期
8 刘挺,吴岩,王开铸;中文自动文摘系统CAAS的研究与实现[J];哈尔滨工业大学学报;1999年06期
9 李石君;于俊清;欧伟杰;;基于HTML模式代数的Web信息提取方法[J];计算机研究与发展;2006年09期
10 李蕾,钟义信,郭祥昊;全信息理论在自动文摘系统中的应用[J];计算机工程与应用;2000年01期
中国重要会议论文全文数据库 前10条
1 翟伟斌;许榕生;;基于Internet的CIS研究[A];第十三届全国核电子学与核探测技术学术年会论文集(下册)[C];2006年
2 李连霞;马军;陈竹敏;;基于多特征的网页内容提取研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
3 王栋;陈勇;徐建良;;基于预测的BitTorrent种子评估方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 王文生;谢能付;;基于Web的农业信息自动抽取方法研究[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
5 施水才;肖诗斌;王弘蔚;王洪俊;苏东庄;;TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 时达明;林鸿飞;杨志豪;;基于网页框架和规则的网页噪音去除方法[A];第三届学生计算语言学研讨会论文集[C];2006年
7 王灿辉;金奕江;马少平;;基于文档中心内容快速提取的Web监控辅助系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 冯少卿;都云程;施水才;;基于模板的网页主题信息抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 张煜;李素建;欧阳佑;;动态多文档自动摘要研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
4 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
5 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
6 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
7 彭涛;面向专业搜索引擎的主题爬行技术研究[D];吉林大学;2007年
8 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
9 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
10 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 李辉阳;面向CAI的简述文字判读技术及其应用研究[D];湘潭大学;2002年
2 吕岷;基于XML的产品信息发布系统[D];武汉科技大学;2002年
3 蒋蔚;面向信息化制造的设备状态信息监视系统开发[D];南京航空航天大学;2003年
4 丛艳;自动文本摘要方法的研究及应用[D];华北电力大学(北京);2004年
5 杨友河;基于XML的ERP环境下的人力资源管理系统研究[D];昆明理工大学;2004年
6 赵珺;基于Web的无机材料网络课件开发平台的研究与应用[D];中南大学;2004年
7 刘云中;基于隐马尔可夫模型的文本信息抽取算法研究[D];湖南大学;2004年
8 张谦;基于Web的数据仓库系统在生产计划管理中的应用研究[D];重庆大学;2004年
9 李辉;基于语义关系的摘要提取[D];南京理工大学;2004年
10 许发见;元数据在教学网站中的应用研究[D];河海大学;2004年
【同被引文献】
中国期刊全文数据库 前1条
1 郭莉,张吉,谭建龙;基于后缀树模型的文本实时分类系统的研究和实现[J];中文信息学报;2005年05期
中国硕士学位论文全文数据库 前1条
1 杨梅;网络舆情热点发现的研究[D];北京交通大学;2008年
【二级参考文献】
中国期刊全文数据库 前5条
1 杨志荣,李磊;用SOM聚类实现多级高维点数据索引[J];计算机研究与发展;2003年01期
2 杨建武,陈晓鸥;半结构化数据相似搜索的索引技术研究[J];计算机学报;2002年11期
3 刘挺,吴岩,王开铸;基于信息抽取和文本生成的自动文摘系统设计[J];情报学报;1997年S1期
4 欧健文,董守斌,蔡斌;模板化网页主题信息的提取方法[J];清华大学学报(自然科学版);2005年S1期
5 孔令波;唐世渭;杨冬青;王腾蛟;高军;;XML数据的查询技术[J];软件学报;2007年06期
【相似文献】
中国期刊全文数据库 前10条
1 魏宁;;基于手机终端的网页自动摘要系统的设计[J];黑龙江科技信息;2011年21期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
中国重要报纸全文数据库 前1条
1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
中国硕士学位论文全文数据库 前9条
1 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
2 陈明;面向Blog的自动摘要与搜索排序算法研究[D];苏州大学;2012年
3 韩颖;中文多网页自动摘要的研究与实现[D];上海交通大学;2007年
4 崔灵珍;Web文本摘要技术的研究与应用[D];武汉理工大学;2007年
5 曹卓文;基础教育网站黄页系统研究[D];南京师范大学;2008年
6 王驰;基于海量网络舆情信息的热点发现[D];电子科技大学;2011年
7 万晶;Web网页正文抽取方法研究[D];南昌大学;2010年
8 刘渊杰;社区问答系统最佳回答机制的研究[D];上海交通大学;2010年
9 沈抖;万维网上数据处理方法的研究[D];清华大学;2004年
相关期刊
>黑龙江科技信息
相关机构
>中国空空导弹研究院;
相关作者
>魏宁
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026