《安徽电子信息职业技术学院学报》2006年04期 加入收藏    获取最新 
 平衡决策树分类精度与规则简易性研究
 华文立;胡学刚
   本文从实用的角度分析了C4.5算法的不足,提出了平衡决策树分类精度和分类规则简易性的观点。在此基础上,提出一个借助遗传算法进行属性组合寻优、进而实现决策树分类精度与规则简易性平衡的决策树优化算法,并为此设计了一个适应度函数。
【作者单位】:合肥工业大学计算机与信息学院;合肥工业大学计算机与信息学院 安徽合肥230090安徽电子信息职业技术学院;安徽蚌埠233000;安徽合肥230090
【关键词】:决策树;遗传算法;适应度函数
【分类号】:TP18
【DOI】:cnki:ISSN:1671-802X.0.2006-04-050
【正文快照】:
  0、引言分类是数据挖掘领域中重要的研究课题之一,分类规则是在已知训练样本的特征和分类结果的基础上,为每一种类型找到一个合理的描述或模型,然后再用这些分类的描述或模型对未知的新数据进行分类。目前已有多种分类理论,如粗糙集理论、神经网络、统计模型、贝叶斯分类器、支持向量机和决策树等,其中,决策树是较为常用的方法之一。其中著名的决策树算法有ID3、C4.5、CA R T等,本文将针对目前较流行的C4.5算法进行讨论。决策树学习是以实例为基础的有监督的归纳学习算法,通过一组无次序、无规则的实例推理出决策树表示形式的分类规则。…
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 The research on the accuracy and rules simplification of Eclectic Decision Tree
 Hua Wen-li;Hu Xue-gang
  This paper analyzes the defects of C4.5 Algorithm from the practical angle and proposes the classification accuracy and the classification rules simplification. Based on these analyses, the paper presents a Decision Tree Optimization Algorithm by means of Genetic Algorithm, the Algorithm which is conducted first by attribute optimization then by realizing the classification accuracy and simplified rules balance of the Decision Tree.
【Keyword】:Decision Tree;Genetic Algorithm;Fitness Function
 【共引文献】 共(2860)篇 
 中国期刊全文数据库找到 10 条
 
1王志军,宋立军; 利用遗传算法求大气压强精确公式 [J];长春大学学报; 2001年05期
2李丽君,黄小原,常良峰; 企业集团税后利润的优化问题 [J];东北大学学报(自然科学版); 2003年05期
3李丽君,胡建忠,黄小原; 非对称信息条件下的成本控制策略 [J];东北大学学报(自然科学版); 2004年08期
4刘智勇,李进,黄道君; 基于遗传算法的视频交通量检测图像分割方法 [J];公路交通科技; 2001年03期
5欧阳森; 改进遗传算法和神经网络在电能质量扰动识别中的应用 [J];电工电能新技术; 2005年03期
6唐慧丰,于洪敏,陈致明; 自适应混合遗传算法在弹药装载中的应用研究 [J];电光与控制; 2005年01期
7束志恒,方士,陈德钊,陈亚秋; 基于正则化网络-遗传算法的属性筛选及其在化学模式识别中的应用 [J];分析化学; 2003年10期
8韩颖,李丽君,黄小原; 生产企业的材料替代策略 [J];东北大学学报(自然科学版); 2003年09期
9袁佳歆,陈柏超,贾嘉斌; 基于遗传算法的逆变器控制规律 [J];电力系统自动化; 2004年24期
10邹璇,李德华; 多关节机械臂的坐标模型和参数标定 [J];光学精密工程; 2001年03期
 中国优秀硕士学位论文全文数据库找到 10 条
 
1朱峰; 医学图像自动分割若干关键技术研究 [D];江苏大学; 2006年
2范明; 聚类算法在Web挖掘中的应用 [D];西北工业大学; 2007年
3陆昊; 专家控制及其在工程船舶运动控制中的应用研究 [D];武汉理工大学; 2006年
4李朝明; 复合同轴全息透镜的研究 [D];苏州大学; 2003年
5李军涛; 基于遗传算法模糊智能变频空调机理的研究 [D];苏州大学; 2003年
6顾永明; 面板堆石坝面板脱空问题分析方法研究 [D];河海大学; 2006年
7胡应环; 基于遗传算法的捆绑销售定价策略研究 [D];福州大学; 2006年
8王勇; 复杂多效蒸发过程模拟与操作优化研究 [D];福州大学; 2006年
9吴绍兵; 基于遗传算法的模糊规则获取研究 [D];云南师范大学; 2005年
10李玲; 基于遗传算法的复杂多效蒸发系统节能技术研究 [D];福州大学; 2005年
 中国博士学位论文全文数据库找到 10 条
 
1苏三买; 遗传算法及其在航空发动机非线性数学模型中的应用研究 [D];西北工业大学; 2002年
2王明宇; 复杂环境下雷达CFAR检测与分布式雷达CFAR检测研究 [D];西北工业大学; 2002年
3谭显春; 面向绿色制造的工艺规划中工艺要素及工艺过程优化方法研究 [D];重庆大学; 2004年
4曹华军; 面向绿色制造的工艺规划技术研究 [D];重庆大学; 2004年
5石庆喜; 因果图学习与推理算法研究 [D];重庆大学; 2005年
6陆哲明; 矢量量化编码算法及应用研究 [D];哈尔滨工业大学; 2001年
7隋洪涛; 基因遗传算法及气动外形最优化设计 [D];南京航空航天大学; 2002年
8沈军; CFRP缠绕压力容器可靠性研究 [D];哈尔滨工业大学; 2006年
9袁颖; 桥梁结构损伤识别方法的相关问题研究 [D];大连理工大学; 2006年
10肖武; 基于流股有效温位的大规模多流股换热器网络综合 [D];大连理工大学; 2006年
 中国重要会议论文全文数据库找到 10 条
 
1张振理,王英勋; 基于CHC算法的无人机航迹规划方法研究 [A];中国航空学会控制与应用第十二届学术年会论文集 [C]; 2006年
2包莉丽,胡正华; 基于机会约束规划的制造/再制造混合系统生产决策 [A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集 [C]; 2006年
3彭世尼,冷婷婷,郑利平,李金良,刘土生; 基于遗传算法的城市燃气管网优化 [A];中国土木工程学会城市燃气分会第九届理事会第一次会议论文集 [C]; 2006年
4冯秋红,刘全坤; 基于多目标优化的扁挤压筒结构设计 [A];第三届华东六省一市塑性工程学术年会论文集 [C]; 2005年
5包莉丽,胡正华; 基于机会约束规划的制造/再制造混合系统生产决策 [A];第八届中国管理科学学术年会论文集 [C]; 2006年
6李彬,毛一之,庞小东; 基于灾变遗传算法的变压器铁心截面优化设计 [A];电工理论与新技术学术年会论文集 [C]; 2005年
7于宁莉,易东云,张栋; 旅行商问题的一种快速有效的遗传算法 [A];第八届中国青年运筹信息管理学者大会论文集 [C]; 2006年
8刘兵兵; 一类非线性二层混合整数规划问题全局最优解的混合遗传算法 [A];第八届中国青年运筹信息管理学者大会论文集 [C]; 2006年
9刘永,张立毅; 基于遗传神经网络盲均衡算法的研究 [A];2006中国西部青年通信学术会议论文集 [C]; 2006年
10万文,曹平,冯涛,袁海平; 基于改进遗传算法的地下空区边坡稳定性分析 [A];第九届全国岩石力学与工程学术大会论文集 [C]; 2006年
 【二级参考文献】 共(5)篇 
 中国期刊全文数据库找到 1 条
 
1王煦法; 遗传算法及其应用 [J];小型微型计算机系统; 1995年02期
 西文参考文献找到 4 条
 
1Holland J H; Genetic algorithms [M];Scientific American; 1992年
2Holland J H; Genetic algorithms and the optimal allocations of trials [M];SIAM Journal of Computing; 1973年
3Ozcan Ender , Mohan Chilukuri K; Partial shape matching using genetic algorithms [M];Pattern Recognition Letters; 1997年
4Ren Qingsheng, Ye Zhongxing; Genetic searching algorithm for optimal runlength-limited codes with error control [M];Journal of China Institute of Communications; 1997年
 【相似文献】 
 中国期刊全文数据库
 
1华文立,胡学刚; 平衡决策树分类精度与规则简易性研究 [J];安徽电子信息职业技术学院学报; 2006年04期; 102-103
2李乃成,陈白丽,高岫; 一个具有对偶适应度函数的遗传算法 [J];西安交通大学学报; 2004年08期; 44-47
3姚文俊; 遗传算法及其研究进展 [J];计算机与数字工程; 2004年04期; 41-43
4杜鹏,周昌乐,贺志强; 一种基于遗传算法的自动生成创意曲动机的方法 [J];计算机技术与发展; 2007年04期; 156-159
5柳炳祥,曹坤,洪晶; 一种改进的决策树遗传算法融合模型 [J];微计算机信息; 2007年12期; 166+264-265
6李建新,柳利军; 一种基于遗传算法的PID参数的优化控制策略 [J];现代电子技术; 2005年02期; 15-16+21
7杨国军,崔平远,李琳琳; 遗传算法在神经网络控制中的应用与实现 [J];系统仿真学报; 2001年05期; 20-23
8郭长辉,王思明,李志强; 基于遗传算法的模糊控制器设计 [J];兰州交通大学学报; 2006年06期; 11-13+17
9马占欣,李亚,陆玉昌; 用遗传算法解决五子棋博弈问题 [J];信阳师范学院学报(自然科学版); 2007年03期; 106-109
10马占欣,李亚,陆玉昌; 用遗传算法解决博弈问题 [J];河南科学; 2007年02期; 107-111
 中国优秀硕士学位论文全文数据库
 
1陆涛栋; 求解车间作业调度的遗传算法 [D];大连理工大学; 2005年
2刘韬; 基于OOTPN的自动化立体仓库出入库调度问题的研究 [D];西安理工大学; 2005年
3周洪伟; 遗传算法“早熟”现象和改进策略研究 [D];解放军信息工程大学; 2004年
4李雅梅; 遗传算法及其在自动控制领域的应用研究 [D];辽宁工程技术大学; 2005年
5杨波; 遗传算法在电力市场交易决策中的应用研究 [D];武汉大学; 2004年
6张春涛; 遗传算法及其在数值逼近中的应用研究 [D];重庆大学; 2004年
7林喜波; 基于遗传算法的装配序列优化 [D];南京理工大学; 2004年
8田延硕; 遗传算法的研究与应用 [D];电子科技大学; 2004年
9姚瑞枫; 多维0-1背包问题的遗传算法研究 [D];武汉科技大学; 2003年
10曾明华; 遗传算法和神经网络在布局子问题中的应用 [D];大连理工大学; 2005年
 中国博士学位论文全文数据库
 
1李海民; 遗传算法性能及其在聚类分析中应用的研究 [D];西安电子科技大学; 1999年
2李智勇; 模式交流多群体遗传算法及其在神经网络进化建模中的应用 [D];湖南大学; 2003年
3甄成刚; 基于图像处理技术的炉膛火焰检测方法研究 [D];华北电力大学(河北); 2004年
4刘西奎; DNA计算和遗传算法的编码与几个优化模型的研究 [D];华中科技大学; 2004年
5侯格贤; 遗传算法及其在跟踪系统中的应用研究 [D];西安电子科技大学; 1998年
6李启青; 遥感数据处理的遗传优化及其组合算法研究 [D];中国科学院研究生院(遥感应用研究所); 2004年
7马国田; 遗传算法及其在电磁工程中的应用 [D];西安电子科技大学; 1998年
8葛培明; 改进的遗传算法及其在工程优化中的应用 [D];西南交通大学; 2006年
9于华男; 开架式水下机器人辨识与控制技术研究 [D];哈尔滨工程大学; 2003年
10莫鸿强; 遗传算法搜索能力和编码方式研究 [D];华南理工大学; 2001年
 中国重要会议论文全文数据库
 
1张福民,孙增圻; 遗传算法在机器人PID控制中的应用 [A];1996年中国智能自动化学术会议论文集(下册) [C]; 1996年
2王志宏,王斌; 基于遗传算法的非确定性目标优化 [A];中国自动化学会全国第九届自动化新技术学术交流会论文集 [C]; 2004年
3于春梅,黄玉清,杨胜波; 遗传算法在参数辨识中的应用进展 [A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集 [C]; 2004年
4刘钊,陈建勋; 基于自适应遗传算法的足球机器人策略设计 [A];2005中国机器人大赛论文集 [C]; 2005年
5张文广,周绍磊,李新; 一种新的改进型自适应遗传算法研究 [A];2005年中国智能自动化会议论文集 [C]; 2005年
6高艳霞,刘峰,王道洪; 改进型遗传算法及其应用研究 [A];2004年生命系统建模仿真国际会议暨第一届全国生命系统建模仿真学术会议论文集 [C]; 2004年
7连广彦,杨宏军,何正伟; 多生境遗传算法 [A];2003年全国系统仿真学术年会论文集 [C]; 2003年
8王航,于歆杰; 遗传算法在故障诊断中应用的新方法 [A];2005年中国智能自动化会议论文集 [C]; 2005年
9宋胜利,冯柯,左敦稳,王珉; 基于遗传算法寻优的PID控制技术研究 [A];中国工程机械学会2003年年会论文集 [C]; 2003年
10曾建潮,王宏刚; 求解全局最优化问题的一种新方法 [A];1996年中国控制会议论文集 [C]; 1996年
 中国重要报纸全文数据库
 
1郭明波; 来自蝙蝠的启发 [N];北京科技报; 2001年
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)