收藏本站
《情报杂志》 2014年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于关键词抽取的微博舆情事件内容聚合

周鹏  蔡淑琴  石双元  王伟  
【摘要】:微博舆情事件会带来严重后果,而碎片化和无序化使得难以从海量的微博内容中全面地认知微博舆情事件的全貌。从微博舆情事件内容聚合出其主要内容具有重要实践价值和研究价值。基于关键词抽取技术KEA提出了一种微博舆情事件内容聚合方法。根据对微博内容篇幅、规范性和网络性的分析,增加中心度特征、词性特征和改进词位置特征,并以朴素贝叶斯分类器抽取关键词集作为聚合输出。最后通过现实微博平台上的内容聚合实验证明本研究所提方法相对基线方法在准确率和召回率上的优势。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 周鹏;蔡淑琴;石双元;;微博危机事件的用户中心化研究[J];情报杂志;2013年03期
【共引文献】
中国期刊全文数据库 前10条
1 谭振华;程维;常桂然;高晓兴;;基于词汇相关度模型的个性化信息检索算法[J];东北大学学报(自然科学版);2008年04期
2 钟晓旭;;层次聚类方法在关键词提取上的研究应用[J];电脑知识与技术;2009年06期
3 尹倩;胡学钢;谢飞;吴信东;;基于密度聚类模式的中文新闻网页关键词提取[J];广西师范大学学报(自然科学版);2009年01期
4 曲桂英;冯丽娜;张志嵩;张志海;;基于用户兴趣模型的个性化信息服务系统研究[J];哈尔滨商业大学学报(自然科学版);2007年03期
5 高波;赵政;;文本层次分类系统的研究[J];计算机工程与应用;2006年11期
6 翟云;杨炳儒;曲武;;不平衡类数据挖掘研究综述[J];计算机科学;2010年10期
7 刘菲;黄萱菁;吴立德;;利用关联规则挖掘文本主题词的方法[J];计算机工程;2008年07期
8 周傲英;周敏奇;宫学庆;;计算广告:以数据为核心的Web综合应用[J];计算机学报;2011年10期
9 邓箴;包宏;;用模拟退火改进的KNN分类算法[J];计算机与应用化学;2010年03期
10 刘兴林;彭宏;马千里;;基于增量词集频率的文本主题词提取算法研究[J];计算机应用研究;2010年09期
中国重要会议论文全文数据库 前5条
1 庞宗强;封化民;邱鹍;宋国森;;基于Web的中文新闻视频内容分析[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
2 章成志;周冬敏;苏新宁;;自动标引通用评价模型研究[A];2007年中国索引学会年会暨学术研讨会论文集[C];2007年
3 张庆国;章成志;薛德军;张君玉;;基于K最近邻的隐含主题自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 陈华;梁循;阮进;;网络与舆情关联分析系统的设计实现[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 李鹏;王斌;石志伟;崔雅超;李恒训;;Tag-TextRank:一种基于Tag的网页关键词抽取方法[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前9条
1 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
2 程勇;基于本体的不确定性知识管理研究[D];中国科学院研究生院(计算技术研究所);2005年
3 姜静清;最小二乘支持向量机算法及应用研究[D];吉林大学;2007年
4 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
5 刘健;基于近似文本分析的意见挖掘[D];上海大学;2007年
6 金博;面向专利和零部件的设计知识检索方法[D];大连理工大学;2009年
7 缪嘉嘉;异构数据映射技术研究[D];国防科学技术大学;2008年
8 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
9 曹隽喆;基于机器学习的多定位点蛋白质亚细胞定位预测方法研究[D];大连理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 王皖;高新技术企业技术创新战略研究[D];哈尔滨理工大学;2010年
2 沈益舒;搜索语句的时间属性研究及其在检索排序中的应用[D];浙江大学;2011年
3 杨振;基于统计的用户网络行为分析和预测[D];北京邮电大学;2011年
4 石爱萍;基于语义距离的Web页面关键词获取研究[D];江苏科技大学;2011年
5 谢晋;基于词跨度的中文文本关键词提取及在文本分类中的应用[D];浙江工业大学;2011年
6 徐学峰;基于系统动力学的网络舆情预警机制模型研究[D];青岛大学;2011年
7 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
8 贺扬;基于潜在语义索引模型的查询语义扩展模型[D];西南交通大学;2004年
9 王艳;个性化信息服务技术及其在防汛会商中应用的研究[D];哈尔滨工程大学;2005年
10 刘列夫;文本数据挖掘在工程图文档中的应用[D];浙江大学;2006年
【二级参考文献】
中国期刊全文数据库 前2条
1 毛清华;高杨;;基于社会网络中心性分析的虚拟团队知识共享促进策略[J];情报杂志;2010年10期
2 高承实;荣星;陈越;;微博舆情监测指标体系研究[J];情报杂志;2011年09期
【相似文献】
中国期刊全文数据库 前10条
1 张文;唐锡晋;;基于Web内容挖掘的信息支持工具AIS-GAE[J];管理评论;2006年09期
2 蒋国瑞;柳中胜;黄梯云;;基于文本挖掘的TBT预警系统实证研究[J];科技进步与对策;2009年19期
3 ;浅析大规模文本数据挖掘技术在媒体中的创新应用[J];中国传媒科技;2007年11期
4 胥桂仙,朴泰雄,杨丹丹,徐小博,高旭;中文文本挖掘中最长频繁序列的发现算法[J];中央民族大学学报(自然科学版);2004年01期
5 冯晋,李春平;基于统计学和语义信息的中文文本主题识别技术[J];清华大学学报(自然科学版);2005年S1期
6 渡部勇;;文本挖掘技术应用于专利检索分析[J];微电脑世界;2007年12期
7 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
8 付国瑜;;Web文本分类挖掘[J];科学咨询(决策管理);2008年03期
9 曹丽君;刘西印;杨燕萍;;WEB页面文本挖掘的价值与未来探究[J];商场现代化;2008年09期
10 韩洁;;Web文本挖掘技术在信息生产领域的应用研究[J];硅谷;2010年08期
中国重要会议论文全文数据库 前10条
1 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
2 卞真旭;;一种关键词抽取方法研究[A];2011年安徽省智能电网技术论坛论文集[C];2011年
3 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
4 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 陈林;王晓华;李殿赟;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
6 李鹏;王斌;石志伟;崔雅超;李恒训;;Tag-TextRank:一种基于Tag的网页关键词抽取方法[A];第六届全国信息检索学术会议论文集[C];2010年
7 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
9 ;TRS搜索引擎和文本挖掘系统[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
10 王波;王厚峰;;基于自学习策略的产品特征自动识别(英文)[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国重要报纸全文数据库 前5条
1 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
2 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 ;未来十年展望之体验技术[N];中国计算机报;2010年
5 ;自助服务BI、实时分析声势渐强[N];网络世界;2011年
中国博士学位论文全文数据库 前10条
1 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
2 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
3 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
4 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
5 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
6 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
7 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
8 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
9 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
10 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
2 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
3 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
4 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
5 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
6 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
7 韩雪娇;英语试题关键词抽取算法研究[D];北方工业大学;2013年
8 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
9 李明;数据清洗技术在文本挖掘中的应用[D];南京理工大学;2008年
10 靳晓恩;数字图书馆的知识发现研究[D];湘潭大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026