收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

神威太湖之光可靠性及可用性设计与分析

高剑刚  胡晋  龚道永  方燕飞  刘骁  何王全  金利峰  郑方  李宏亮  
【摘要】:随着系统规模与集成度的快速增加,可靠性与可用性问题成为构建E级计算机系统所面临的重大挑战.针对神威太湖之光超级计算机可靠性与可用性设计与实现开展全面的分析.首先概要描述神威太湖之光超级计算机系统结构.其次,系统提出神威太湖之光超级计算机可靠性增强技术以及故障预测、主动迁移、任务局部降级等主被动容错技术,建立神威太湖之光超级计算机多层次主被动协同的容错系统.再次,根据系统故障统计信息,分析失效分布及主要失效来源,结合指数、对数正态与韦布尔3种典型寿命周期分布,对神威太湖之光系统故障间隔时间分布进行数据拟合分析.最大似然估计与K-S(Kolmogorov Smirnov)检验结果表明,对数正态分布与系统失效经验数据取得了最好的拟合度,建立神威太湖之光系统失效分布模型,并计算得出系统平均无故障时间.通过系统运行统计与实际应用测试,分析了故障预测精确度以及主动迁移、局部降低等容错技术的时间开销与容错效果.最后,在神威太湖之光超级计算机可靠性与可用性分析的基础上,提出E级计算机系统高可靠与高可用技术发展建议.

知网文化
【相似文献】
中国期刊全文数据库 前19条
1 刘耀,胡越明,金利峰;高可靠计算机系统的容错技术[J];计算机工程;2004年S1期
2 陈炜;计算机容错技术与应用[J];武汉工业大学学报;1998年04期
3 孙国萌;薛高阜;;网络服务器容错技术[J];军事通信技术;2000年02期
4 ;未雨绸缪话容错技术[J];计算机与网络;2004年06期
5 吴云峰;;浅谈容错技术[J];金融电子化;1999年11期
6 张岩鹏;企业的坚强基石——高可靠性的Sun Netrat运营级服务器[J];广东通信技术;2000年12期
7 杨鸿华;;计算机系统容错技术研究[J];黑龙江科技信息;2015年28期
8 陈卫;孟浩;商伶俐;高宁;;容错技术及其在电力机车测控系统中的应用[J];华北科技学院学报;2012年02期
9 赵晋起;;浅谈高可用性系统设计[J];电脑知识与技术;2008年03期
10 王俊岭,汪芸;基于主动复制容错技术的负载平衡模型[J];计算机工程;2005年11期
11 夏祖德;雷镜湖;;硬件容错技术[J];电子技术;1987年10期
12 博能;企业的坚强基石──高可靠性的Sun Netrat运营级服务器[J];市场与电脑;2000年11期
13 杨洪章;杨雅辉;屠要峰;孙广宇;吴中海;;基于“采集—预测—迁移—反馈”机制的主动容错技术[J];计算机研究与发展;2020年02期
14 邵清;魏赟;;《计算机系统容错技术》课程教学研究与探讨[J];上海理工大学学报(社会科学版);2006年03期
15 黎珊珊;实时分布式计算机系统的容错技术研究[J];计算机与数字工程;2002年06期
16 冯登国,刘文清;浅谈信息安全与容错技术[J];中国计算机用户;2000年07期
17 郑明;硬件容错技术[J];自动化博览;1994年01期
18 孙清河;浅谈服务器的可用性[J];中国计算机用户;2004年35期
19 黄蕾;;计算机系统容错技术的思考[J];计算机产品与流通;2017年10期
中国重要会议论文全文数据库 前8条
1 单书畅;胡瑜;李晓维;;多核处理器的核级冗余容错技术[A];第六届中国测试学术会议论文集[C];2010年
2 张鲁飞;程华;;高性能计算机容错技术综述[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
3 王东盛;;容错技术在卫星控制系统中的应用[A];第十届全国容错计算学术会议论文集[C];2003年
4 盖璐璐;张涛;徐建军;谭庆平;;一种低开销的可配置容错技术[A];第十九届计算机工程与工艺年会暨第五届微处理器技术论坛论文集[C];2015年
5 刘绍南;;高可用性系统中的存储技术[A];第四届中国青年运筹与管理学者大会论文集[C];2001年
6 董爱堂;师胜利;张聚久;;高可用性系统介绍[A];第11届全国计算机在现代科学技术领域应用学术会议论文集[C];2003年
7 龚健;杨孟飞;;硬件进化系统的容错性研究[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
8 杨威;;基于PC服务器高可用性应用平台的研究与实现[A];2008年电力信息化高级论坛论文集[C];2008年
中国博士学位论文全文数据库 前7条
1 杨志勇;基于容错及检错的云存储可靠性技术研究[D];武汉理工大学;2015年
2 许方亮;云存储中基于纠删码的数据容错技术研究[D];国防科技大学;2019年
3 郑霄;超级计算机系统的可用性评估研究[D];解放军信息工程大学;2009年
4 李旭;基于非易失内存的高性能计算容错技术研究[D];国防科学技术大学;2013年
5 黄达;基于忆阻器的自治容错技术研究[D];国防科学技术大学;2014年
6 孙伟东;分布式存储中基于纠删码的数据容错技术研究[D];国防科学技术大学;2015年
7 李建立;面向瞬时故障的可配置容错技术研究[D];国防科学技术大学;2013年
中国硕士学位论文全文数据库 前20条
1 杨娜;融合容错需求和资源约束的云容错服务适配方法研究[D];内蒙古大学;2017年
2 王博伟;嵌入分布系统多模式容错技术研究[D];西北工业大学;2007年
3 刘琳;基于分层调度的实时系统容错技术研究[D];湖南大学;2013年
4 代征;弹性函数在弹性容错技术中的应用研究[D];武汉大学;2004年
5 夏康;高可靠并行星载计算机硬件容错技术研究[D];上海交通大学;2013年
6 吴振宇;高可用性附网存储集群的研究与实现[D];华中科技大学;2004年
7 刘翠英;分布式系统后向恢复容错技术研究[D];山东大学;2011年
8 琚巍巍;分布式存储系统容错技术的研究与实现[D];西安电子科技大学;2009年
9 任必晋;口令恢复在神威太湖之光上的优化与实现[D];郑州大学;2020年
10 张国强;星载并行处理计算机系统容错技术研究[D];国防科学技术大学;2006年
11 赵荣生;同行评审在打印机可用性测试中的应用研究[D];湖南大学;2012年
12 刘海清;飞控计算机的容错研究与设计[D];复旦大学;2009年
13 朱浩;云环境下MapReduce容错技术的研究[D];上海交通大学;2012年
14 张淑燕;基于嵌入式多核平台的并行冗余线程容错技术研究[D];哈尔滨工业大学;2009年
15 张海龙;基于服务器系统高可靠性的结构优化研究[D];天津大学;2019年
16 黄宏韬;大数据云存储中数据容错技术研究[D];福州大学;2016年
17 余莹;异构系统中基于可用性的抢占式任务调度算法研究[D];湖南大学;2009年
18 芦伟;基于纠删码容错的并行文件系统优化技术研究和实现[D];国防科学技术大学;2015年
19 肖慧荣;虚拟化技术的高可用性机制优化策略的研究与设计[D];北京邮电大学;2015年
20 王俊岭;基于主动复制的负载平衡模型研究与实现[D];东南大学;2005年
中国重要报纸全文数据库 前20条
1 ;容错技术的发展与应用展望[N];计算机世界;2001年
2 本报记者 程鸿;贴近大众的高可用性[N];计算机世界;2001年
3 ;无时间损失的容错技术[N];中国计算机报;2003年
4 ;满足高可用性需求[N];中国计算机报;2002年
5 深圳特区报记者 李剑辉 王剑锋 李丽 秦绮蔚;神威·太湖之光:青春华彩写就中国超算世界第一[N];深圳特区报;2019年
6 记者 过国忠 特约通讯员 段芳;中国“神威·太湖之光”再登超算巅峰[N];科技日报;2017年
7 中国青年报·中青在线记者 李超 通讯员 周婷;攀上世界超算最高峰 青春闪耀“太湖之光”[N];中国青年报;2017年
8 本报记者 马薇;“神威·太湖之光”为产业创新赋能[N];新华日报;2018年
9 中国青年报·中青在线记者 李新玲;我国超级计算机“神威太湖之光”问鼎世界冠军[N];中国青年报;2016年
10 ;容错技术成为服务器市场的黑马[N];中国国门时报;2004年
11 本报记者 张晔;每秒10亿亿次!我“神威·太湖之光”成世界最快超算[N];科技日报;2016年
12 记者 吴红梅 浦敏琦;“神威·太湖之光”荣膺超算冠军[N];新华日报;2016年
13 地球系统科学研究中心计算机系;清华运营的“神威·太湖之光”荣膺世界超算冠军[N];新清华;2016年
14 记者 张建列 通讯员 冯春;“神威太湖之光”全球最快[N];广东科技报;2016年
15 记者 林小春;中国“神威·太湖之光”再次问鼎世界超算冠军[N];科技日报;2016年
16 本报记者 何进伟;HP保证数据100%的可用性[N];网络世界;2002年
17 ;Windows Server 2003可靠性增强[N];计算机世界;2003年
18 ;博科SAN提升系统高可用性[N];计算机世界;2009年
19 ;UPS设计5大新理念[N];网络世界;2005年
20 ;惠普高可用性群集解决方案[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978