收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于等差隐私预算分配的大数据决策树算法

尚涛  赵铮  舒王伟  刘建伟  
【摘要】:针对传统差分隐私保护方案以剩余隐私预算的一半逐层分配,即等比分配隐私预算,被应用于决策树时,随着决策树高度的增加,分配至顶层的隐私预算过小,随机噪声过大,分类准确率受到影响的问题,作者提出以差分隐私保护结合主流决策树C4.5分类方法为基本思路,依据决策树高度等差分配隐私预算的方案。差分隐私中的Laplace机制和指数机制确保决策树分类的安全性。作者利用大数据Hadoop平台的MapReduce框架,主程序进行MapReduce参数配置以及外层循环。在执行到每一个节点时,主程序将数据集属性的统计任务交给Mapper类,Reducer类接收Mapper类的统计结果并利用Laplace机制添加随机噪声,加噪结果返回主程序中作为计算信息增益率的参数。主程序利用指数机制选择最佳细分方案,递归过程直至样本数为0时停止。实验采用UCI数据库的car数据集进行测试,在不同隐私预算下将等比分配与等差分配两种方案得到的分类结果准确率进行对比。实验结果表明:本文算法在可接受的分类准确率降低的情况下满足差分隐私保护;与传统隐私预算分配相比,本文算法在相同隐私预算下提高了分类准确率;对于car数据集,本文算法在隐私预算为0.7或0.8时可较好兼顾数据集的安全性和有效性。因此,在一定程度上依据决策树高度等差分配隐私预算的方案可改善分类准确率,可实际应用于决策树分类算法。

知网文化
【相似文献】
中国期刊全文数据库 前12条
1 吴媛媛;沈雪明;;基于隐私保护的决策树构造[J];计算机工程;2006年03期
2 沈思倩;毛宇光;江冠儒;;不完全数据集的差分隐私保护决策树研究[J];计算机科学;2017年06期
3 林青;;大数据背景下隐私保护方法研究[J];信息与电脑(理论版);2018年07期
4 方贤进;肖亚飞;杨高明;;大数据及其隐私保护[J];大数据;2017年05期
5 何贤芒;王晓阳;陈华辉;董一鸿;;差分隐私保护参数ε的选取研究[J];通信学报;2015年12期
6 逄菲;;大数据安全与隐私保护探究[J];电脑知识与技术;2018年22期
7 柯臻轩;余露芸;郭志勇;;大数据时代下个人隐私保护的调研分析[J];经济研究导刊;2015年02期
8 杨贵军;孟杰;王双喜;;基于赤池信息准则的分类回归决策树剪枝算法[J];计算机应用;2014年S2期
9 胡荣磊;何艳琼;曾萍;范晓红;;一种大数据环境下医疗隐私保护方案设计与实现[J];信息网络安全;2018年09期
10 张雪召;;大数据信息通信技术对个人隐私保护的影响分析[J];通讯世界;2017年07期
11 陈媛;;大数据时代下的个人隐私保护[J];商;2016年22期
12 李英;;大数据安全挑战与隐私保护[J];电脑知识与技术;2015年13期
中国重要会议论文全文数据库 前10条
1 孙通源;;基于局部聚类和杂度增益的数据信息隐私保护方法探讨[A];中国水利学会2013学术年会论文集——S4水利信息化建设与管理[C];2013年
2 王涛;叶晓俊;;一种执行隐私保护机制的扩展RBAC模型[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 黄尤江;贺莲;苏焕群;郑丽荣;;医学大数据之平衡发展与隐私保护[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
5 毛典辉;蔡强;李海生;曹健;;一种自适应情景的位置隐私保护方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
6 刘鹏;姚正;尹俊杰;;一种实用有效的决策树改进模型及其实现[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 ;深度保护敏感数据 从手机隐私保护开始[A];第29次全国计算机安全学术交流会论文集[C];2014年
10 张逸飞;江伟玉;王雷;彭佳;;针对追踪器的用户自主隐私保护方案[A];第33次全国计算机安全学术交流会论文集[C];2018年
中国博士学位论文全文数据库 前10条
1 宋金玲;K-匿名隐私保护模型中与匿名数据相关的关键问题研究[D];燕山大学;2012年
2 钱萍;物联网同态隐私保护关键技术研究[D];南京邮电大学;2017年
3 李晔;具有隐私保护的外包数据分类方法研究[D];哈尔滨工业大学;2018年
4 周志刚;云环境下数据隐私保护与安全搜索技术研究[D];哈尔滨工业大学;2018年
5 张磊;基于用户协作的位置隐私保护研究[D];哈尔滨工程大学;2018年
6 万盛;位置服务的隐私保护关键技术研究[D];西安电子科技大学;2018年
7 马鑫迪;移动感知推荐系统中隐私保护研究[D];西安电子科技大学;2018年
8 晏燕;大数据发布隐私保护技术研究[D];兰州理工大学;2018年
9 许志凯;移动互联网下位置隐私保护技术研究[D];哈尔滨工业大学;2016年
10 李拴保;面向云计算环境的用户权限管理与隐私保护研究[D];武汉大学;2015年
中国硕士学位论文全文数据库 前10条
1 陈思思;基于扰动技术的隐私保护数据挖掘研究[D];四川师范大学;2014年
2 徐垚;基于复杂网络的差分隐私保护研究[D];广西大学;2017年
3 韩博文;可穿戴设备数据隐私保护技术的研究[D];北京交通大学;2018年
4 王越;基于差分隐私的社交网络隐私保护方法研究[D];哈尔滨工业大学;2016年
5 刘彦;位置大数据服务中面向信息分析的隐私保护方法研究[D];南京邮电大学;2017年
6 徐阳;基于政务数据的隐私保护模型研究[D];南京信息工程大学;2014年
7 刘乾坤;基于匿名化的隐私保护数据挖掘技术的研究[D];哈尔滨工业大学;2017年
8 万丽;基于属性相关的差分隐私保护机制研究[D];哈尔滨工程大学;2018年
9 张建川;基于边相关贝叶斯网络的差分隐私数据发布方法[D];哈尔滨工程大学;2018年
10 李松存;数据流查询隐私保护技术研究[D];哈尔滨工程大学;2018年
中国重要报纸全文数据库 前10条
1 方兴东 浙江传媒学院互联网与社会研究院院长;像爱护眼睛一样重视隐私保护[N];环球时报;2018年
2 本报驻德国特约记者 青木 本报特约记者 甄翔;世界最严隐私保护法生效,企业慌了[N];环球时报;2018年
3 Commvault大中华区总经理 王波;数据隐私保护呈现三大趋势[N];中国电子报;2019年
4 江晓原 刘兵;大数据时代:要安全要便利还是要隐私?[N];中华读书报;2017年
5 张绪旺;隐私保护莫要躲着用户[N];北京商报;2018年
6 复旦大学管理学院副教授 褚荣伟;大数据时代隐私保护的开关在哪里?[N];社会科学报;2018年
7 记者 钱童心;美国隐私保护法呼之欲出,科技巨头在合规代价与隐私保护间摇摆[N];第一财经日报;2018年
8 陆仁;唤醒“沉睡”大数据应突破认识误区[N];宁波日报;2017年
9 史洪举;保护隐私应成互联网企业的底线[N];人民政协报;2017年
10 记者 潘晟;各国“加码”数据隐私保护[N];上海金融报;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978