收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

文本分类中基于对数似然比测试的特征词选择方法

李国臣  
【摘要】:本文将对数似然比测试用于文本分类中的特征词选择。与传统的频度、集中度和分散度等多种统计指标的测试独立进行的方法相比较,这种方法利用协方差矩阵协调了各个统计指标之间的联系,从而将它们有机地统一为一个整体。实验显示,这种特征词选择方法优于传统的频度测试、集中度测试和分散度测试独立进行的特征词选择的方法。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘玉琴;赖院根;雷孝平;;基于IPC知识结构的专利自动分类模型[J];小型微型计算机系统;2007年12期
2 刘沛骞;冯晶晶;;一种改进的朴素贝叶斯文本分类算法[J];微计算机信息;2010年27期
3 邓擘;樊孝忠;;使用特征词的统计分布信息进行文本分类[J];计算机工程与应用;2006年32期
4 鲍翠梅;;支持向量机在文本特征提取中的应用研究[J];计算机应用与软件;2010年05期
5 陈键;胡学刚;;词分布均衡度评价特征词选取方法的文本分类[J];安徽科技学院学报;2009年02期
6 王海涌,郑丽英,刘丽艳;基于文本表示的特征项权值确定方法研究[J];甘肃科学学报;2005年03期
7 邓擘;樊孝忠;杨立公;;基于统计分布与集合论的文本分类方法[J];北京理工大学学报;2006年07期
8 杨凯峰;张毅坤;李燕;;基于文档频率的特征选择方法[J];计算机工程;2010年17期
9 程传鹏;;一种改进的X~2统计量方法[J];中原工学院学报;2010年06期
10 吴卫华,袁宁,周劲,王洪军;基于文本集密度的特征词选择与权重计算方法[J];计算机与数字工程;2005年03期
11 巩玉玺;张春海;韩彦稳;;邮件过滤中基于关联分析的潜在特征词挖掘[J];青岛理工大学学报;2006年02期
12 唐歆瑜;乐文忠;李志成;李军义;;基于知网语义相似度计算的特征降维方法研究[J];科学技术与工程;2006年21期
13 赵小华;马建芬;;文本分类算法中词语权重计算方法的改进[J];电脑知识与技术;2009年36期
14 史晶蕊,郑玉明,韩希;人工神经网络在文本分类中的应用[J];计算机应用研究;2005年10期
15 周永健;郑玉明;廖湖声;;基于模糊聚类的文本分类器[J];微电子学与计算机;2006年S1期
16 胡学钢;董学春;谢飞;;基于词向量空间模型的中文文本分类方法[J];合肥工业大学学报(自然科学版);2007年10期
17 陈素萍;谢丽聪;;一种文本特征选择方法的研究[J];计算机技术与发展;2009年02期
18 袁方;苑俊英;;基于类别核心词的朴素贝叶斯中文文本分类[J];山东大学学报(理学版);2006年03期
19 沈志斌;白清源;;文本分类中特征权重算法的改进[J];南京师范大学学报(工程技术版);2008年04期
20 邓箴;包宏;;用模拟退火改进的KNN分类算法[J];计算机与应用化学;2010年03期
中国重要会议论文全文数据库 前10条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 周永健;郑玉明;廖湖声;;基于模糊聚类的文本分类器[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
10 董学春;胡学钢;谢飞;吴共庆;;基于词向量空间模型的文本分类方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 温昌衍;客家方言特征词研究[D];暨南大学;2001年
3 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
6 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
7 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
8 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
9 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
10 郝立柱;汉语文本自动分类[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 董慧;基于多元权重特征加权的中文文本分类算法[D];中北大学;2011年
2 张玉杰;基于偏斜数据集的中文文本分类问题的改进特征权重算法研究[D];东北师范大学;2010年
3 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
4 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
5 赵小华;KNN文本分类中特征词权重算法的研究[D];太原理工大学;2010年
6 闫晨;KNN文本分类研究[D];燕山大学;2010年
7 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
8 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
9 郭志毅;基于EM算法的半监督文本分类方法研究[D];重庆邮电大学;2010年
10 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年
中国重要报纸全文数据库 前10条
1 本报记者 胡珉琦;论文反抄袭软件被“攻克”[N];北京科技报;2011年
2 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
3 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
4 俞扬;“洪武赶散”与泰州方言[N];泰州日报;2006年
5 朱莉;互联网应用你知道多少?[N];中国电脑教育报;2006年
6 林俊铭;漳州地名用字解析[N];闽南日报;2008年
7 云南 张康宗;安全至上[N];电脑报;2003年
8 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
9 周小荣;一堂生动的语文课[N];中国电脑教育报;2003年
10 希安;微软试水信息检索[N];经济日报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978