收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文情感分类挖掘预处理关键技术比较研究

夏火松  刘建  朱慧毅  
【摘要】:比较研究了中文情感分类挖掘预处理技术的不同组合对分类效果的影响。预处理中关键技术为文本分词、特征选择和权重计算。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI、文本证据权(Weight of Evi-dence for Text,WET)5种不同的特征选取方法和布尔权重、词频型特征权重TF、TF—IDF函数3种常用的权重计算方法的15种不同组合。采用支持向量机(SVM)分类器以考察特征选择方法和权重计算方法不同的组合的对情感分类的效果。实验结果表明IG和TF-IDF的组合最为有效,WET和TF的组合效果最差,并给出了效果差异的原因。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈雅;谭华军;郑建明;;图书馆个性化服务中的Web日志分析技术研究[J];图书馆杂志;2011年07期
2 黄瑾娉;苏庭波;;一种产品评论信息的意见挖掘技术研究[J];工业控制计算机;2011年06期
3 谭啸峰;沈海斌;;基于主元分析的空间手写平面化预处理技术[J];机电工程;2011年08期
4 潘禄生;;基于Arnold变换和混沌序列的灰度图像置乱算法[J];科学技术与工程;2011年19期
5 袁健;金鑫;;一种重构网站结构的Web日志挖掘数据预处理方法[J];小型微型计算机系统;2011年07期
6 王岩;周萧;;针对人脸识别的图像预处理[J];科技信息;2011年16期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李岷;王晓玲;周傲英;;CREX——基于缓存和预处理技术的XML检索架构[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 张紫琼;李一军;叶强;;汉语商品评论情感分析——一种基于搜索引擎的无监督方法(英文)[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 左维松;昝红英;张坤丽;吴云芳;;规则和统计相结合的情感分析研究[A];第五届全国信息检索学术会议论文集[C];2009年
4 刘晓静;黄维通;;三维模型预处理技术及其在检索中的应用[A];第四届和谐人机环境联合学术会议论文集[C];2008年
5 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
6 马立权;李维;蔡韩辉;路莹;李歆;;手写数字识别中的预处理技术研究[A];中国仪器仪表学会第三届青年学术会议论文集(上)[C];2001年
7 杨伟东;陈永彬;;使用VQ的汉语讲话人识别研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
8 李洪波;于洪志;;藏语语音识别的预处理研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 闫永慧;;空间数据挖掘中数据预处理技术探讨[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
10 侯培国;赵静;刘明;;基于小波变换的图像去噪[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 刘健;基于近似文本分析的意见挖掘[D];上海大学;2007年
2 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
3 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年
4 单润红;Toeplitz系统的高效预处理技术和分布式并行算法研究[D];国防科学技术大学;2004年
5 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
6 范文茹;生物电阻抗成像技术研究[D];天津大学;2010年
7 李文军;块代数多重网格算法的研究及其实现技术在在油藏数值模拟软件中的应用[D];中国科学院软件研究所;2001年
8 仲妍;大型稀疏线性方程组并行求解及预处理技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗辑;基于数字图像处理技术的火焰生长速率的测试[D];西安电子科技大学;2007年
2 江明华;数据挖掘技术在篮球技术动作中的应用研究[D];重庆大学;2007年
3 汪莉栋;Web日志挖掘中数据预处理算法的研究及实现[D];贵州大学;2008年
4 马灵春;程序理解中静态分析与抽取技术的研究及实现[D];浙江工业大学;2007年
5 丁秀梅;基于块Broyden方法的并行预处理技术的研究[D];南京邮电大学;2011年
6 李彬;Web使用挖掘技术的研究与实现[D];电子科技大学;2007年
7 柴俊华;基于模糊理论的视频预处理技术[D];上海师范大学;2010年
8 王宏;印刷体汉字识别预处理的研究[D];大连理工大学;2008年
9 石岚峰;工程图三维重建中的信息提取与预处理技术研究[D];湖南大学;2006年
10 王孔茂;轮胎X射线检验机图像采集与预处理技术[D];天津大学;2012年
中国重要报纸全文数据库 前1条
1 ;用简化技术实现实时图形绘制[N];中国计算机报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978