收藏本站
《计算机应用与软件》 2012年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

有效的中文微博短文本倾向性分类算法

韩忠明  张玉沙  张慧  万月亮  黄今慧  
【摘要】:对具有长度短、结构复杂以及变形词多等特点的短文本倾向性分类进行深入研究,目的是提高倾向性分类的准确性和效率。以HowNet的情感词典为基础,提出一个微博新词发现算法,构建微博情感词典。在对文本进行分句、分词、标注、情感处理等后,构建一个自动机来计算短文本情感倾向性。为了客观评价该方法,选择基于HowNet的分类方法、基于SVM的分类方法进行比较性实验。实验结果表明提出的方法在一般文本分类上与SVM效果类似,在短文本上则具有明显的优势。同时该方法在效率上也具有突出优势。
【作者单位】北京工商大学计算机与信息工程学院;
【基金】:国家自然科学基金项目(61170112)
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前7条
1 王素格;杨安娜;李德玉;魏英杰;李伟;张武;;基于支持向量机的文本倾向性分类研究[J];中北大学学报(自然科学版);2008年05期
2 昝红英;郭明;柴玉梅;吴云芳;;新闻报道文本的情感倾向性研究[J];计算机工程;2010年15期
3 丁建立;慈祥;黄剑雄;;网络评论倾向性分析[J];计算机应用;2010年11期
4 何凤英;;基于语义理解的中文博文倾向性分析[J];计算机应用;2011年08期
5 王根;赵军;;基于多重冗余标记CRFs的句子情感分析研究[J];中文信息学报;2007年05期
6 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
7 杨超;冯时;王大玲;杨楠;于戈;;基于情感词典扩展技术的网络舆情倾向性分析[J];小型微型计算机系统;2010年04期
【共引文献】
中国期刊全文数据库 前10条
1 葛斌;蒋林承;肖延东;史宗麟;郭丝路;;网络论坛意见领袖挖掘系统设计与实现[J];电脑知识与技术;2011年22期
2 郭建忠;成毅;傅文棋;杨海鹏;;突发事件网络舆情可视化研究与实现[J];地矿测绘;2012年04期
3 何建民;刘明星;;面向特定主题的客户抱怨文本分类识别方法[J];合肥工业大学学报(自然科学版);2010年12期
4 何忠育;王勇;王瑛;陈新;廖朝辉;;基于分布式计算的网络舆情分析系统的设计[J];警察技术;2010年03期
5 王素格;杨安娜;李德玉;;基于汉语情感词表的句子情感倾向分类研究[J];计算机工程与应用;2009年24期
6 李培;何中市;黄永文;;基于依存关系分析的网络评论极性分类研究[J];计算机工程与应用;2010年11期
7 周城;葛斌;唐九阳;肖卫东;;基于相关性和冗余度的联合特征选择方法[J];计算机科学;2012年04期
8 昝红英;郭明;柴玉梅;吴云芳;;新闻报道文本的情感倾向性研究[J];计算机工程;2010年15期
9 黄贤立;;基于典型相关分析的多视图跨领域情感分类[J];计算机工程;2010年24期
10 昝红英;左维松;张坤丽;吴云芳;;规则和统计相结合的情感分析研究[J];计算机工程与科学;2011年05期
中国重要会议论文全文数据库 前5条
1 王克;张春良;高晓兴;朱靖波;;基于三类训练两类判别框架的主客观性句子识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 吴琼;谭松波;张刚;段洣毅;程学旗;;基于图排序模型的跨领域倾向性分析算法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 左维松;昝红英;张坤丽;吴云芳;;规则和统计相结合的情感分析研究[A];第五届全国信息检索学术会议论文集[C];2009年
4 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
5 杨江;侯敏;王宁;;基于主题情感句的汉语评论文倾向性分析[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
2 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
3 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
4 徐军;面向金融信息检索的体裁分类与情感分析技术研究[D];哈尔滨工业大学;2011年
5 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
6 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
7 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
8 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
9 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
10 张丽;在线评论的客户参与动机与评论有效性研究[D];南开大学;2011年
中国硕士学位论文全文数据库 前10条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
3 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
4 邓忠莹;中文文本倾向性分类系统研究[D];昆明理工大学;2009年
5 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
6 罗亚平;面向网络舆情的中文评论文本情感倾向分析研究[D];东北财经大学;2010年
7 戴霖;网络舆情信息挖掘关键技术研究与应用[D];浙江工商大学;2011年
8 吴秀梅;基于潜在语义分析和最大熵的中文情感分析研究[D];北京交通大学;2011年
9 申莹;针对确定话题的离散文本舆情聚类与可视化研究[D];武汉理工大学;2011年
10 张博;基于SVM的中文观点句抽取[D];北京邮电大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
2 应伟;王正欧;安金龙;;一种基于改进的支持向量机的多类文本分类方法[J];计算机工程;2006年16期
3 潘宇;林鸿飞;;基于语义极性分析的餐馆评论挖掘[J];计算机工程;2008年17期
4 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
5 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
6 周茜,赵明生,扈旻;中文文本分类中的特征选择研究[J];中文信息学报;2004年03期
7 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
8 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
9 李峰;李芳;;中文词语语义相似度计算——基于《知网》2000[J];中文信息学报;2007年03期
10 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
中国硕士学位论文全文数据库 前1条
1 张锦明;中文语义倾向识别的关键算法研究[D];北京邮电大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 吴建胜,战学刚,迟呈英;一种基于自动机的分词方法[J];计算机工程与应用;2005年08期
2 董振东;机器翻译中词典和文法的关系[J];中文信息学报;1988年03期
3 江明德,菊燕;面向对象程序设计体裁嵌入FFP-AST系统[J];软件学报;1990年04期
4 赵菊英,陈子南;《遥感大词典》的诞生侧记——向中国环境遥感学会十周年献礼[J];遥感学报;1991年04期
5 顾犇;《牛津英语词典》评介[J];国家图书馆学刊;1994年Z1期
6 祝启波;一部专业技术双语词典的计算机转换及其结果分析[J];辞书研究;1997年05期
7 周明;怎能如此欺骗读者?——从对《新世纪现代汉语词典》的炒作谈起[J];中国图书评论;2001年11期
8 于新国;也谈字典、词(辞)典的分类──兼与王菊花同志商榷[J];江苏图书馆学报;1994年04期
9 ;《英汉航海·航运·船舶大词典》即将出版[J];航海技术;1995年01期
10 王世昌;基于自动机的分析与综合因素神经网络的自动实现方法[J];计算机研究与发展;1996年09期
中国重要会议论文全文数据库 前10条
1 申晓晔;封化民;毋非;;基于语义理解的Web新闻倾向性分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 刘鸿宇;赵妍妍;秦兵;刘挺;;评价对象抽取及其倾向性分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 晁继周;;关于汉语规范型词典收词问题的思考[A];中国辞书论集1999[C];1999年
4 陆福庆;;词典的收词问题[A];辞书编纂经验荟萃[C];1992年
5 徐祖友;;谈谈词典的附录[A];辞书编纂经验荟萃[C];1992年
6 徐庆凯;;为专题词典正名[A];中国辞书论集2000[C];2000年
7 李尔钢;;词典的编排与检索[A];辞书编纂经验荟萃[C];1992年
8 章宜华;;西方词典释义类型和释义结构研究[A];中国辞书论集2000[C];2000年
9 陆尊梧;;有关词典质量的几个问题[A];中国辞书论集1997[C];1997年
10 姜治文;文军;;设置词典课,加强对词典用法的指导[A];中国辞书学文集[C];1998年
中国重要报纸全文数据库 前10条
1 本报记者 唐宋;一本词典见证时代变迁[N];人民日报;2005年
2 洪玉华 冯威 公权 (本报记者 洪玉华 冯威);两岸合编中华大词典 共襄民族共同语[N];中国新闻出版报;2009年
3 本报见习记者 范昕;要不要把“热词”当回事儿?[N];文汇报;2009年
4 钰添 编译;法国秋季词典市场 三大主角上演新三国演义[N];中国图书商报;2004年
5 庞可慧;“期待”不“期待”,观众说了算[N];语言文字周报;2010年
6 记者 陈菁霞;国内首部内向型汉语学习词典近日面世[N];中华读书报;2010年
7 记者 周翼双;众多新词进入新版《现代汉语规范词典》[N];中国新闻出版报;2010年
8 李高超巩晓俐;哈利·波特上法院[N];国际商报;2008年
9 黄敏;翻翻新版《韦氏大词典》,不然你OUT了[N];新华每日电讯;2009年
10 本报记者 张贵勇;维基百科:知识因草根而改变[N];中国教育报;2009年
中国博士学位论文全文数据库 前10条
1 杜伟夫;文本倾向性分析中的情感词典构建技术研究[D];哈尔滨工业大学;2010年
2 吴晓真;英语为源语言词典编纂中的用户友善问题[D];复旦大学;2004年
3 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
4 范洪博;快速精确字符串匹配算法研究[D];哈尔滨工程大学;2011年
5 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
6 胡圣明;基于内存自动机与模式的动态引擎构造技术研究[D];西安电子科技大学;2009年
7 黄正;基于词典排序的群体理性聚合分析[D];西南大学;2012年
8 张文涛;E-Service接口行为分析及其在服务组合中的应用[D];北京邮电大学;2007年
9 胡熠;面向信息检索的文本内容分析[D];上海交通大学;2007年
10 陈优广;边界跟踪、区域填充及链码的应用研究[D];华东师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 唐琴;受限领域中文情感问答系统研究[D];大连理工大学;2008年
2 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年
3 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
4 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
5 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
6 孙根胜;火炮自动机模拟试验装置总体设计与仿真[D];南京理工大学;2004年
7 黄建才;入侵检测中高效的模式匹配算法的研究[D];河北大学;2004年
8 周子力;城市交通流智能控制及仿真研究[D];华东师范大学;2004年
9 邝华;混合车辆元胞自动机交通流模型的研究[D];广西师范大学;2004年
10 吴大艳;三车道元胞自动机交通流模型的研究[D];广西师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026