收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

抗好词攻击的中文垃圾邮件过滤模型

邓蔚  秦志光  刘峤  程红蓉  
【摘要】:针对当前中文垃圾邮件过滤领域面临的好词攻击威胁,提出了一种鲁棒的中文垃圾邮件过滤模型。该模型基于多示例学习机制,并结合中文分词和特征选择方法,将一封邮件转化为若干示例的组合,然后应用多示例逻辑回归模型进行学习和分类。对多示例学习而言,当一封邮件中至少有一个示例为垃圾信息时,该邮件为垃圾邮件,否则为正常邮件。分别对训练数据集和测试数据集进行好词攻击,在多个大规模中文垃圾邮件过滤公开数据库上进行了测试。实验结果表明,在中文邮件过滤领域对抗好词攻击,分类器使用多示例反击策略较之于单示例反击策略有更强的鲁棒性。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 王春燕;袁津生;;一种结合多示例学习的图像检索方法[J];计算机系统应用;2010年06期
2 李大湘;彭进业;卜起荣;;基于场景语义的图像检索新方法[J];系统工程与电子技术;2010年05期
3 王颖;陈治平;;结合K-means的分类方法在电信客户流失中的应用[J];佳木斯大学学报(自然科学版);2010年02期
4 李大湘;彭进业;卜起荣;;基于QPSO-MIL算法的图像标注[J];计算机科学;2010年06期
5 李大湘;彭进业;李展;;基于半监督多示例学习的对象图像检索[J];控制与决策;2010年07期
6 虞杲;宋广卫;;利用数据挖掘技术建立客户异动监控模型[J];通信企业管理;2010年08期
7 韩学鸿;贾瑞敏;;数据挖掘技术的应用研究综述与启示——在会计舞弊识别研究中的应用[J];今日科苑;2010年16期
8 王刚;许信顺;;一种新的基于多示例学习的场景分类方法[J];山东大学学报(理学版);2010年07期
9 贺建军;王欣;顾宏;王哲龙;;基于Logistic回归模型和凝聚函数的多示例学习算法[J];大连理工大学学报;2010年05期
10 李大湘;彭进业;李展;;集成模糊LSA与MIL的图像分类算法[J];计算机辅助设计与图形学学报;2010年10期
中国重要会议论文全文数据库 前10条
1 陈玉;郭华东;蔺启忠;;基于RS与GIS的舟曲县泥石流易发性初步评估[A];Proceedings of 2010 International Conference on Remote Sensing (ICRS 2010) Volume 4[C];2010年
2 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
3 何莉;林鸿飞;;基于主题划分的分布式检索混合结果合并技术研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 唐先发;李敏;杜文辉;王培光;高敏;周文明;杜卫东;杨森;张学军;;寻常型银屑病LCE3D基因rs4085613位点基因型和临床表型分析[A];2009全国中西医结合皮肤性病学术会议论文汇编[C];2009年
5 王芳;林丹华;;父母因素和同伴因素与工读学生饮酒行为的关系[A];第十二届全国心理学学术大会论文摘要集[C];2009年
6 孙果;;西安市青少年吸烟行为与家庭因素的关系[A];第十二届全国心理学学术大会论文摘要集[C];2009年
7 张震;;基于多示例学习算法的用户感兴趣区域发现[A];中国通信学会第六届学术年会论文集(下)[C];2009年
8 彭国胜;;青年农民工就业质量问题的实证研究——以长沙市为例[A];科学发展观与青少年和青少年工作研究报告——第五届中国青少年发展论坛暨中国青少年研究会优秀论文集(2009)[C];2009年
9 李强;高文珺;高文珺;白炳清;龙鲸;刘敏;;心理疾病患者自我污名及影响初探[A];中国社会心理学会2008年全国学术大会论文摘要集[C];2008年
10 陈绮文;;肥胖相关行为因素危险性综合评价标准的初步研制[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
中国博士学位论文全文数据库 前10条
1 叶亮;基于统计回归的复杂制造过程健壮参数控制方法研究[D];上海交通大学;2010年
2 王志旺;基于GIS技术的区域滑坡分形特征分析与危险性评价[D];中国地质大学;2010年
3 查正军;基于机器学习方法的视觉信息标注研究[D];中国科学技术大学;2009年
4 赵凌潇;基于流形的半监督分类方法研究[D];浙江大学;2009年
5 李杰;基于内容的图像检索方法研究[D];中国科学技术大学;2008年
6 连竑彬;中国上市公司财务报表舞弊现状分析及甄别模型研究[D];厦门大学;2008年
7 李芳;GMAW-P数字电源设计及熔滴过渡特征信号提取与建模研究[D];上海交通大学;2008年
8 易文晟;图像语义检索和分类技术研究[D];浙江大学;2007年
9 向坚;基于三维捕获数据的人体运动分析关键技术研究[D];浙江大学;2007年
10 石智勇;巴塞尔新资本协议下的内部评级法研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 王利肖;基于MapGIS的哀牢山区域滑坡风险评价研究[D];中国地质大学(北京);2010年
2 郑侠;福建省地质灾害调查数据库的数据挖掘与滑坡早期预警模型实现[D];中国地质大学(北京);2010年
3 缪瑾秋;新审计准则对审计质量的影响[D];南京理工大学;2010年
4 许坤;高新技术企业人才流失预警模型研究[D];北方工业大学;2010年
5 高珊珊;企业资源对制药企业战略转型的影响研究[D];西南大学;2010年
6 赵清;商业银行信用评级中逻辑回归与判别分析的对比[D];山东大学;2010年
7 王前进;网络口碑和传统口碑对消费者购买决策影响力的差异研究[D];山东大学;2010年
8 钟鑫;基于逻辑回归和高斯混合模型的设备故障诊断技术研究与应用[D];北京化工大学;2010年
9 郭向红;移动用户流失预警研究方法与应用模型[D];内蒙古大学;2010年
10 吕洋;基于现金流量的高新技术企业财务预警研究[D];西安理工大学;2010年
中国重要报纸全文数据库 前10条
1 编译 饮冰;子宫内膜异位与牙周炎有关[N];医药经济报;2009年
2 白水;反式脂肪增加女性不孕危险[N];中国医学论坛报;2007年
3 本版编辑 钟旭 朱元珏;阻塞性睡眠呼吸暂停与代谢综合征而非胰岛素抵抗状态存在独立相关性[N];中国医学论坛报;2007年
4 ;借助品牌建设吸引人才[N];第一财经日报;2006年
5 于津生;信用评分方法的技术基础[N];金融时报;2006年
6 火焱;光疗成功后新生儿PTB仍可反弹[N];中国医学论坛报;2006年
7 天天;ALOX5启动子基因型可预测儿童哮喘严重程度[N];中国医学论坛报;2006年
8 文童;超声测量PT/NB比值和食指长度可筛查唐氏综合征[N];中国医学论坛报;2006年
9 文华;女性更易发生洋地黄不良反应[N];中国医学论坛报;2006年
10 书童;大型经腹手术切除妇科肿瘤后肺栓塞发生率显著升高[N];中国医学论坛报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978