收藏本站
《计算机技术与发展》 2011年09期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于成词概率的贝叶斯垃圾邮件过滤方法

林伟  
【摘要】:贝叶斯分类方法在英文邮件过滤中效果良好,在中文环境下一直表现不佳,而特征选择是垃圾邮件过滤中的重要步骤,它能够有效地改善过滤效果。文中以成词概率作为特征选择的基础,用构造的方法形成候选特征集,然后进一步用信息增益的方法来度量特征与类的关系,选择信息增益较大的N个特征做为最后的特征向量空间。在此基础上利用贝叶斯方法对邮件进行分类,实验结果验证了该方法在分类时间和分类效果上都优于传统的基于机械分词的贝叶斯方法。
【作者单位】四川警察学院计算机系;
【基金】:四川省青年软件创新工程基金(2007AA42)
【分类号】:TP393.098

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 董梅;胡学钢;;基于多特征选择的中文文本分类[J];计算机技术与发展;2007年07期
中国博士学位论文全文数据库 前1条
1 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前1条
1 王申;基于内容的垃圾邮件过滤技术的若干研究[D];中国科学院研究生院(计算技术研究所);2005年
【共引文献】
中国期刊全文数据库 前10条
1 李玉鑑;周兰珍;操卫平;;基于DF和CHI的联合特征提取方法及其应用[J];北京工业大学学报;2008年09期
2 杨勇涛;;文本自动摘要提取算法[J];成都大学学报(自然科学版);2009年02期
3 袁晓峰;;一种基于主题的Web文本聚类算法[J];成都大学学报(自然科学版);2010年03期
4 薛松;张钟澍;殷知磊;;贝叶斯算法在反垃圾邮件应用中的改进方案[J];成都信息工程学院学报;2009年04期
5 陈可华;;文本自动分类新探究[J];赤峰学院学报(自然科学版);2011年04期
6 殷宏威;赵伟;杨志伟;;蚁群算法在KNN文本分类中的应用[J];长春理工大学学报(自然科学版);2010年01期
7 吕佳;;基于改进分类模型的文本分类系统实现[J];重庆师范大学学报(自然科学版);2009年02期
8 李家兵;;基于交叉覆盖算法的文本分类研究[J];滁州学院学报;2008年05期
9 李艳玲;戴冠中;覃森;;快速的文本倾向性分类方法(英文)[J];电子科技大学学报;2007年06期
10 朱颖;;浅谈HMM在词性标注中的应用[J];电脑开发与应用;2011年03期
中国重要会议论文全文数据库 前10条
1 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
2 张铮;胡社教;江萍;;基于EP模式的特征选择算法[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
3 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 张艳;李毅;顾健;;垃圾邮件与反垃圾邮件新技术追踪[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 张娟;王慧锋;;文本分类技术在海量金融信息处理中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
7 曹玉娟;牛振东;彭学平;江鹏;;一个基于特征向量的近似网页去重算法[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年
8 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
9 门洪;武玉杰;李小英;高艳春;;基于支持向量机的分类算法研究[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
10 郎加云;胡学钢;;电子邮件内容过滤的相关特征研究[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 黄东山;特征选择及半监督分类方法研究[D];华中科技大学;2011年
2 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
3 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
4 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
5 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
6 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
7 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
8 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
9 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
10 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 林楠;文本特征选择算法研究[D];辽宁师范大学;2010年
2 朱文龙;基于行为分析的垃圾邮件过滤技术研究[D];哈尔滨工程大学;2010年
3 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年
4 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
5 左洪艳;僵尸网络检测系统的研究与设计[D];北京邮电大学;2011年
6 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年
7 王雅菲;文本分类中特征降维方法的研究[D];长春工业大学;2010年
8 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
9 李琼琼;网络文本自动分类器的设计与实现[D];电子科技大学;2010年
10 周杰;网络舆情话题情感倾向性分析技术研究[D];解放军信息工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前7条
1 李文斌,刘椿年,黄佳进;基于数据挖掘的垃圾E-mail过滤方法[J];北京工业大学学报;2003年02期
2 王建勇,谢正茂,雷鸣,李晓明;近似镜像网页检测算法的研究与评价[J];电子学报;2000年S1期
3 刘洋,杜孝平,黄星华,侯志辉,郭晨,周二胜,骆焕林;垃圾邮件的智能过滤系统设计探讨[J];微机发展;2003年04期
4 周威成,马素霞,齐林海;一种基于机器学习的垃圾邮件智能过滤方法[J];现代电力;2003年01期
5 刘贵全,陈小平,张波,赵雷;基于Agent的信件自动处理系统的实现[J];小型微型计算机系统;2000年11期
6 沈卫超;邮件过滤器系统的设计与实现[J];信息与电子工程;2003年02期
7 孙丽华,张积东,李静梅;一种改进的kNN方法及其在文本分类中的应用[J];应用科技;2002年02期
【相似文献】
中国期刊全文数据库 前10条
1 时红梅;高茂庭;;垃圾邮件过滤技术及发展[J];计算机与数字工程;2008年06期
2 李兆翠;刘培玉;周洪利;;基于贝叶斯方法的客户端邮件过滤器的设计与实现[J];信息技术与信息化;2007年03期
3 闫斐;;基于贝叶斯模型的邮件过滤系统[J];太原师范学院学报(自然科学版);2010年02期
4 刘洋;曹津宁;刘昊;秦玉平;;基于贝叶斯方法的垃圾邮件处理模型研究[J];长春工程学院学报(自然科学版);2007年03期
5 王志波;;双层垃圾邮件过滤模型研究[J];郑州轻工业学院学报(自然科学版);2010年03期
6 张萍;韩立娜;;对邮件过滤技术发展现状的比较与分析[J];计算机与数字工程;2008年04期
7 汤伟;程家兴;纪霞;;一种基于概率推理的邮件过滤系统的研究与设计[J];计算机技术与发展;2008年08期
8 余楚迎;李建忠;;构建一个大容量用户、安全的电子邮件系统[J];汕头大学学报(自然科学版);2005年04期
9 何绍华;运用贝叶斯方法过滤垃圾邮件[J];现代计算机;2004年05期
10 庞雅静;朱金钧;;一种基于贝叶斯理论实现垃圾邮件过滤的方法[J];电脑知识与技术(学术交流);2007年02期
中国重要会议论文全文数据库 前10条
1 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
2 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
3 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
5 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
6 David Z.D'Argenio;;贝叶斯方法在实验室研究向临床的转化以及辨识隐含亚群体中的应用(英文)[A];中国药理学会临床药理学专业委员会会议暨第十次全国临床药理学学术会议论文集[C];2007年
7 蒋富勤;赵航芳;;运动目标状态序贯贝叶斯滤波[A];浙江省信号处理学会2011学术年会论文集[C];2011年
8 方敬;肖扬;;超声波图像边界抽取的贝叶斯方法及其在图像分割中的应用[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
9 张志斌;施水才;吕学强;;基于贝叶斯方法的中文垃圾邮件过滤技术综述[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 唐健;张建慧;傅敏;;宽带网络流量矩阵估计的自适应正则贝叶斯方法ARBM[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 李梅影;电子邮件立法对抗垃圾邮件泛滥[N];国际金融报;2004年
2 ;6个僵尸网络发出85%垃圾邮件[N];人民邮电;2008年
3 本报记者 余世琳;任金强:治理垃圾邮件要立法与自律并行[N];通信信息报;2003年
4 IT Boy;拿什么拯救你我们的电子邮件[N];中国电脑教育报;2004年
5 《周刊》记者 张旭东;中国反垃圾邮件要立法[N];中国计算机报;2004年
6 策划 孙定 林江艳 执笔 王翌;邮件灾祸[N];计算机世界;2004年
7 孟广业;从源头遏制垃圾邮件传播[N];人民邮电;2004年
8 朱杰;当垃圾邮件穿上“图片”马甲[N];中国计算机报;2007年
9 陈翔;垃圾邮件7月忙换招[N];中国计算机报;2007年
10 ;把握特征阻断垃圾邮件[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
3 江敏;贝叶斯优化算法的若干问题研究及应用[D];上海大学;2012年
4 曲彦文;贝叶斯滤波若干问题研究[D];南京理工大学;2010年
5 刘伟;基于贝叶斯方法的有限混合模型选择[D];东北师范大学;2010年
6 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
7 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
8 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
9 张洪刚;贝叶斯概率水文预报系统及其应用研究[D];武汉大学;2005年
10 陈斌;瘦肉型猪的场内遗传评估及遗传分析研究[D];湖南农业大学;2005年
中国硕士学位论文全文数据库 前10条
1 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
2 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
3 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
4 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
5 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
6 宋文;图像垃圾邮件过滤技术的研究[D];淮北师范大学;2011年
7 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年
8 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
9 金彩琴;基于意图分析的垃圾邮件过滤研究[D];陕西师范大学;2011年
10 刘菊新;垃圾图像过滤系统的实现[D];浙江大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026