收藏本站
《计算机科学与探索》 2010年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

适于垃圾文本流过滤的条件概率集成方法

刘伍颖  王挺  
【摘要】:通过用于垃圾文本流过滤的在线文本分类研究,提出了一种新的条件概率集成方法。采用语汇序列表示文本,使用索引结构存储分类知识,设计实现了分类模型的在线训练算法和在线分类算法。抽取电子邮件和手机短信的多种文本特征,分别在TREC07P电子邮件语料和真实中文手机短信语料上进行了垃圾信息过滤实验。实验结果表明,提出的方法能够获得很好的垃圾信息过滤效果。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 姜远;周志华;;基于词频分类器集成的文本分类方法[J];计算机研究与发展;2006年10期
【共引文献】
中国期刊全文数据库 前7条
1 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
2 蒋宗礼;徐学可;;一种基于集成学习与类指示器的文本分类方法[J];北京工业大学学报;2010年04期
3 刘明;袁保宗;苗振江;唐晓芳;李昆仑;;从局部分类精度到分类置信度的变换[J];计算机研究与发展;2008年09期
4 姜远;佘俏俏;黎铭;周志华;;一种直推式多标记文档分类方法[J];计算机研究与发展;2008年11期
5 王冬平;王清贤;罗军勇;李炳龙;;BMP图像碎片重组中的候选权重方法[J];计算机应用;2007年12期
6 刘伍颖;王挺;;基于词模型索引的短文本在线过滤方法[J];华中科技大学学报(自然科学版);2010年04期
7 钱爱兵;江岚;;基于标题的中文新闻网页自动分类[J];现代图书情报技术;2008年10期
中国博士学位论文全文数据库 前4条
1 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
2 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
3 刘赫;文本分类中若干问题研究[D];吉林大学;2009年
4 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前2条
1 张国萍;基于类核心词的文本分类技术研究[D];江西理工大学;2008年
2 徐学可;网页文本分类及其在搜索引擎中的应用[D];北京工业大学;2008年
【二级参考文献】
中国期刊全文数据库 前2条
1 马亮,陈群秀,蔡莲红;一种改进的自适应文本信息过滤模型[J];计算机研究与发展;2005年01期
2 唐春生,金以慧;基于全信息矩阵的多分类器集成方法[J];软件学报;2003年06期
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026