收藏本站
《计算机工程与应用》 2019年17期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于集成特征选择的点击欺诈检测方法

郭汉  帅仁俊  张欣  李鑫  
【摘要】:网络在线广告中以套取广告费为目的的点击欺诈已经严重影响了网络广告的稳定发展。从FDMA2012竞赛提供的欺诈发布商检测的真实数据集出发,针对冗余特征会降低训练效率以及不平衡数据会使决策边界发生偏倚的问题,提出了一种基于集成特征选择的网络在线广告点击欺诈检测方法。采用Bagging方法和合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)相结合的方法将多数的正常点击广告发布商样本与少数的欺诈点击广告发布商样本构造为多个袋装子集,利用基于相关性度量的特征选择算法对每个袋装子集中筛选出特征子集,设置阈值得到特征合集,利用随机森林算法构建点击欺诈检测模型。实验结果表明该方法能够有效识别出实施欺诈点击行为的非法发布商,达到网络在线广告中点击欺诈检测的要求。

【参考文献】
中国期刊全文数据库 前2条
1 刘国卿;;一种新的点击欺诈防范算法[J];计算机工程;2011年S1期
2 龚尚福;姜晓旭;;基于用户行为分析的广告欺诈点击检测[J];计算机应用与软件;2011年04期
中国博士学位论文全文数据库 前1条
1 曹正凤;随机森林算法优化研究[D];首都经济贸易大学;2014年
中国硕士学位论文全文数据库 前2条
1 马骊;随机森林算法的优化改进研究[D];暨南大学;2016年
2 乔晨蕊;网络广告中的点击欺诈检测方法研究[D];哈尔滨工程大学;2016年
【共引文献】
中国期刊全文数据库 前1条
1 王东;;数据挖掘在检测农业补贴中欺诈行为的应用——基于异常检测与神经网络模型[J];平顶山学院学报;2015年05期
中国博士学位论文全文数据库 前10条
1 王琳琳;肺腺癌和肺鳞癌特征性基因的筛选及使用SAM-GSR算法区分NSCLC亚型[D];吉林大学;2018年
2 殷林飞;基于深度强化学习的电力系统智能发电控制[D];华南理工大学;2018年
3 段宇飞;鸡蛋多品质高通量在线快速无损检测研究[D];华中农业大学;2017年
4 贾斌;基于机器学习和统计分析的DDoS攻击检测技术研究[D];北京邮电大学;2017年
5 鞠哲;基于支持向量机的赖氨酸翻译后修饰位点预测方法研究[D];大连理工大学;2016年
6 邴其春;城市快速路交通状态评估与预测关键技术研究[D];吉林大学;2016年
7 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年
8 刘擎超;基于集成学习的交通状态预报方法研究[D];东南大学;2015年
9 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
10 张万军;基于大数据的个人信用风险评估模型研究[D];对外经济贸易大学;2016年
中国硕士学位论文全文数据库 前10条
1 丁文豪;恶意爬虫主动防御技术研究与实现[D];北京邮电大学;2019年
2 陈志添;基于决策树的诊断相关组分类研究[D];华南理工大学;2018年
3 刘小庆;全国基本医疗保险欺诈行为智能监测研究[D];首都经济贸易大学;2018年
4 王宇桥;基于广义S变换和随机森林算法的癫痫脑电信号特征提取与分类研究[D];吉林大学;2018年
5 许远静;病态嗓音特征提取与识别算法的研究[D];广西师范大学;2018年
6 宋双;基于权重学习的着色方法研究[D];山东师范大学;2018年
7 岳千;基于数据挖掘技术对心脏病诊断的研究[D];陕西科技大学;2018年
8 何嘉林;基于随机森林与贝叶斯优化算法的排水管道缺陷检测算法研究[D];广东工业大学;2018年
9 范德祥;基于LightGBM的居民出行方式选择模型及应用研究[D];华中科技大学;2018年
10 张向前;机器学习在辐射源信号指纹识别中的应用研究[D];电子科技大学;2018年
【二级参考文献】
中国期刊全文数据库 前6条
1 李学凯;许笑;孙春奇;张伟哲;李斌;;面向垂直搜索引擎的Web站点划分方案[J];计算机工程;2010年08期
2 袁健;张劲松;马良;;一种有效预防点击欺诈的策略[J];计算机应用;2009年07期
3 刘春年;潘钦;;网络广告欺诈点击的性质分析与防范[J];商业时代;2008年08期
4 田立勤;林闯;;可信网络中一种基于行为信任预测的博弈控制机制[J];计算机学报;2007年11期
5 王先林;丁圣伟;;网络广告中的点击欺诈及其对策[J];中国工商管理研究;2007年04期
6 陈亮;;颠覆点击付费[J];互联网周刊;2006年43期
中国博士学位论文全文数据库 前1条
1 李云飞;基于人工智能方法的股票价值投资研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前7条
1 邱荣财;基于Spark平台的CURE算法并行化设计与应用[D];华南理工大学;2014年
2 姚洪哲;Hadoop平台的MapReduce模型性能优化研究[D];电子科技大学;2014年
3 李宝镜;搜索引擎广告中策略性出价和点击欺诈问题的研究[D];重庆大学;2013年
4 翟永东;Hadoop分布式文件系统(HDFS)可靠性的研究与优化[D];华中科技大学;2011年
5 雍凯;随机森林的特征选择和模型优化算法研究[D];哈尔滨工业大学;2008年
6 韩翘;网络广告的精准营销策略研究[D];吉林大学;2008年
7 吴祎;在线广告点击欺骗的检测和应用[D];上海交通大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 刘国卿;;一种新的点击欺诈防范算法[J];计算机工程;2011年S1期
2 董亚楠;刘学军;李斌;;一种基于用户行为特征选择的点击欺诈检测方法[J];计算机科学;2016年10期
3 张祖莲;卡米力·木衣丁;王命全;;一种有效预防点击欺诈的算法[J];计算机应用;2010年07期
4 崔亚芬;解男男;;一种基于特征选择的入侵检测方法[J];吉林大学学报(理学版);2015年01期
5 闫鹏;郑雪峰;朱建勇;肖赟泓;;一种基于嵌入式特征选择的垃圾邮件过滤模型[J];小型微型计算机系统;2009年08期
6 袁健;张劲松;马良;;一种有效预防点击欺诈的策略[J];计算机应用;2009年07期
7 刘飞飞;;入侵检测中特征选择技术的应用[J];计算机时代;2018年09期
8 申健;夏靖波;张晓燕;赵广辉;付凯;;基于分治排序策略的流量二次特征选择[J];电子学报;2017年01期
9 孔德艳;陈磊;;一种基于云计算平台的网络流量分类系统模型[J];网络安全技术与应用;2019年08期
10 刘汝隽;贾斌;辛阳;;基于信息增益特征选择的网络异常检测模型[J];计算机应用;2016年S2期
中国博士学位论文全文数据库 前2条
1 任宇林;结构化预测中N元特征选择算法的研究[D];华中科技大学;2018年
2 Reehan Ali Shah;基于稀疏模型组合的网络入侵分类[D];浙江大学;2019年
中国硕士学位论文全文数据库 前10条
1 乔晨蕊;网络广告中的点击欺诈检测方法研究[D];哈尔滨工程大学;2016年
2 任亚缙;网络广告中防范欺诈点击技术的研究[D];兰州交通大学;2014年
3 张祖莲;网络点击欺诈及预防策略的研究[D];新疆大学;2011年
4 向婵;基于互信息的特征选择在入侵检测中的优化研究[D];昆明理工大学;2018年
5 刘翔;融合杜鹃搜索的灰狼优化算法及其在入侵检测中的应用[D];湖北工业大学;2018年
6 吴兵;基于万有引力粒子群算法的网络视频业务特征选择[D];南京邮电大学;2018年
7 王峰;蚁群算法在网络入侵特征选择上的应用研究[D];湖南大学;2017年
8 沈永良;基于改进烟花算法的SVM特征选择和参数优化的研究[D];安徽大学;2018年
9 黄婷;基于特征选择的集成学习在入侵检测中的应用[D];兰州大学;2017年
10 郑芳泉;稀有数据的集成特征选择与入侵检测[D];福州大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026