收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

云计算环境下朴素贝叶斯文本分类算法的实现

江小平  李成华  向文  张新访  
【摘要】:采用分布式编程MapReduce模型研究了文本统一格式预处理、训练、测试以及分类等基于朴素贝叶斯文本分类算法主要计算过程的MapReduce并行化方法,并在Hadoop云计算平台进行了实验。实验结果表明:朴素贝叶斯文本分类算法MapReduce并行化后在Hadoop云计算平台上部署运行,具有较好的加速比,对中文网页文本分类识别率达到了86%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 安婷;;云计算在高校教育信息化建设中的应用浅析[J];科学咨询(科技·管理);2010年10期
2 刘猛;;探析云计算中的信息安全[J];电脑编程技巧与维护;2010年24期
3 张凌超;;基于“云计算”的数字图书馆建设模式初探[J];图书馆学研究;2010年21期
4 廉琪;;云计算在移动学习中的应用探究[J];中国信息技术教育;2010年20期
5 严真;;云计算环境下的图书馆变革[J];图书馆工作与研究;2010年02期
6 袁红军;;云计算环境下数字参考咨询服务模式构建[J];情报科学;2010年04期
7 白才进;王红;;建构图书馆的“云”时代[J];图书情报工作;2009年23期
8 王希馗;;浅析图书馆中云计算技术的应用[J];信息与电脑(理论版);2011年05期
9 余楚礼;肖迎元;尹波;;一种基于Hadoop的并行关联规则算法[J];天津理工大学学报;2011年01期
10 赵学磊;;云计算在消防部队信息化建设中的应用初探[J];电脑编程技巧与维护;2010年12期
11 王小妮;高学东;倪晓明;;基于云计算的分布式数据挖掘平台架构[J];北京信息科技大学学报(自然科学版);2011年05期
12 于志良;;基于云计算的数字化校园的研究[J];电脑知识与技术;2010年14期
13 宋旸;朱毅;;基于云计算的动漫渲染技术的研究[J];电脑知识与技术;2011年30期
14 张健;;云计算概念和影响力解析[J];电信网技术;2009年01期
15 孙剑华;;未来计算在“云端”——浅谈云计算和移动学习[J];现代教育技术;2009年08期
16 陈全;邓倩妮;;云计算及其关键技术[J];计算机应用;2009年09期
17 陈维崧;陈庆秋;;基于云计算的GIS研究[J];测绘与空间地理信息;2011年01期
18 闫振东;高斌;;一种海量军事信息的数据云管理系统[J];电讯技术;2011年06期
19 张媛媛;赵广宇;余华鸿;;云计算与高校教学教育资源整合[J];今日科苑;2009年04期
20 刘炜;;图书馆需要一朵怎样的“云”?[J];大学图书馆学报;2009年04期
中国重要会议论文全文数据库 前10条
1 张望;王辉;;个性化服务中的并行K-Means聚类算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
2 丛鹏;;MPI并行计算实现工业CT图像重建[A];2004年CT和三维成像学术年会论文集[C];2004年
3 杜志文;曾文华;;网格计算在文本分类中的应用[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
4 焦龙;郭亚红;纪守领;李金宝;;基于多核计算机的分子动力学并行算法的实现[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
5 卢健康;梁得胜;;一种适于并行计算的高精度LTI系统快速仿真算法[A];2003年全国系统仿真学术年会论文集[C];2003年
6 杨晓云;马永利;齐丽萍;;应用并行和集群技术提高地震处理性能[A];第十八届中国(天津)’2004IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2004年
7 王同权;于万瑞;冯煜芳;;微机集群的并行蒙特卡罗模拟[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
8 赵帆;潘无名;;面向多Agent的并行计算框架研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 魏春梅;宋庭新;;基于网格计算的分布式并行计算与仿真技术[A];湖北省机械工程学会设计与传动学会、武汉机械设计与传动学会2008年学术年会论文集(1)[C];2008年
10 万晓华;张法;刘志勇;;一种冷冻电子断层三维重构的并行迭代算法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 张理论;面向气象预报数值模式的高效并行计算研究[D];中国人民解放军国防科学技术大学;2002年
2 张帆;过程系统优化的分布式并行计算[D];浙江大学;2002年
3 张禹;基于并行计算的复合生物测定鉴别[D];吉林大学;2006年
4 孙安香;数值气象预报变分同化的伴随模式并行计算[D];中国人民解放军国防科学技术大学;2002年
5 陈平;数据挖掘网格若干关键技术研究[D];北京邮电大学;2007年
6 明平剑;基于非结构化网格气液两相流数值方法及并行计算研究与软件开发[D];哈尔滨工程大学;2008年
7 李波;基于异构多核平台的优化编程研究[D];华中科技大学;2011年
8 王建;并行最优化算法与软件设计及数值软件移植[D];中国科学院研究生院(软件研究所);2005年
9 李戈;基于并行处理的机器人立体视觉伺服系统研究[D];哈尔滨工业大学;2007年
10 姚震;并行程序设计模型若干问题研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 金光浩;有向图并行计算中的多目标剖分算法[D];中国工程物理研究院;2005年
2 吴颖;一种基于LINUX的集群计算系统的设计与实现[D];四川大学;2005年
3 彭虹;分形视频图像压缩并行算法设计[D];福州大学;2006年
4 朱丽莎;基于GPU的一维热传导算法研究[D];暨南大学;2011年
5 袁加全;基于Java多线程的有限元并行计算的研究[D];天津工业大学;2006年
6 于海征;基于JavaSpaces分布式计算技术的应用研究[D];新疆大学;2005年
7 胡向前;基于FP-Tree的多层关联规则挖掘算法研究[D];重庆大学;2005年
8 李伟华;JIFEX软件有限元分析并行化[D];大连理工大学;2006年
9 赵振兴;C-SI系统的分子动力学并行仿真[D];大连理工大学;2008年
10 孙再强;基于CORBA的网络并行计算环境的设计与实现[D];西安电子科技大学;2001年
中国重要报纸全文数据库 前10条
1 刘琦;伯克利专家展望未来并行计算[N];中国计算机报;2008年
2 英特尔并行计算实验室研究员 TimothyMattson;并行计算:减少串行软件[N];中国计算机报;2007年
3 ;并行算法研究进展[N];中国计算机报;2004年
4 Intel编程系统实验室 Ali-RezaAdl-Tabatabai;TM将取代互斥锁助益并行编程[N];中国计算机报;2008年
5 本报记者 瑜文;“星火燎原”多核大学扩张在即[N];中国电脑教育报;2007年
6 李琳琳;应用程序迎接多核时代[N];计算机世界;2006年
7 曙光技术支持中心副总经理 曹振南;中尺度数值气象预报系统的架构方法[N];中国计算机报;2007年
8 清华大学计算机系 都志辉;奠基未来[N];计算机世界;2001年
9 ;做高校科研的铺路石[N];中国电脑教育报;2006年
10 本报记者 陈淑娟;英特尔:多核时代的软件创新[N];计算机世界;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978