当前位置:99696大富豪棋牌 > 今日头条 > Rocky版本的全球最大规模单一集群实践,在云环境

Rocky版本的全球最大规模单一集群实践,在云环境

文章作者:今日头条 上传时间:2019-12-26

云计算环境中,高可用是IaaS层必备的特性,在云环境中,失效状态是云管理系统必须解决的问题,研究并增强高可用性无疑是一个很有价值并且具有挑战性的工作。

本系列会分析OpenStack 的高可用性(HA)概念和解决方案:

本系列会分析OpenStack 的高可用性(HA)概念和解决方案:

99696大富豪棋牌 1

可用性是指系统在执行任务的任意时刻能正常工作的概率,提高可用性需要强调减少从灾难中恢复的时间。从某种意义而言,提高可用性就是一场与时间的赛跑,从故障中恢复的耗时越短,价值就越大。

(1)OpenStack 高可用方案概述

(1)OpenStack 高可用方案概述

原标题:基于OpenStack Rocky版本的全球最大规模单一集群实践,浪潮云海如何做到? 近日,浪潮云海InCloud OpenStack 5.6完成单一集群规模达500节点的测试,这是目前已知的基于Op...

浪潮InCloud OpenStack从产品设计之初,就将HA作为第一优先级的需求。目前,OpenStack开源社区并没有一个完整的云业务HA解决方案。起初社区认为虚拟机的HA不是云平台层次的特性,虚拟机的HA应该通过应用层面而不是在云平台层面来实现。但是在实际部署中,有相当数量的应用并不具有应用层面的HA,OpenStack在HA特性上的缺失带来了业务中断的风险。随后社区也提出过计算节点HA解决方案,例如在管理程序或其底层硬件出现故障时,虚拟机在不同的计算节点上自动重启等,但方案仍然是相对不成熟的、实验性的,并没有应用到生产环境上来。而比较受关注的Masakari项目也由于未考虑虚拟机脑裂和计算节点的隔离,缺乏成熟的应用场景。

(2)Neutron L3 Agent HA - VRRP (虚拟路由冗余协议)

(2)Neutron L3 Agent HA - VRRP (虚拟路由冗余协议)

原标题:基于OpenStack Rocky版本的全球最大规模单一集群实践,浪潮云海如何做到?

从度量可用性“三维”入手

(3)Neutron L3 Agent HA - DVR (分布式虚机路由器)

(3)Neutron L3 Agent HA - DVR (分布式虚机路由器)

近日,浪潮云海InCloud OpenStack 5.6完成单一集群规模达500节点的测试,这是目前已知的基于OpenStack Rocky版本的全球最大规模单一集群实践。

如何提升OpenStack的HA特性,从而消除用户的使用障碍,使更多的用户从开源云计算中受益?浪潮基于对行业客户上云的深刻理解和丰富的实践经验,认为应该先从度量虚拟机、关键进程和物理机的可用性“三维”入手,有的放矢的采取多种维度的故障检测与应对策略,解决云环境特别是大规模云环境的可用性问题,从而实现高可用的云环境。

(4)Pacemaker 和 OpenStack Resource Agent (RA)

(4)Pacemaker 和 OpenStack Resource Agent (RA)

Rocky版本发布于一年前,是目前最新的社区稳定版本。资料显示,OpenStack开源版本部署达到200个节点时性能会出现明显下降,达到500节点时其可用性难以保障,能否支撑企业的“大云”需求,一直是业界关注的焦点。因此,浪潮发起了此次基于OpenStack Rocky版本的大规模集群实践。

业务虚拟机宕机:组件服务程序的运行时异常,如系统资源不足或者hypervisor层的系统bug都有可能引起业务虚拟机宕机的发生,导致对外服务的中断,影响用户正常业务开展。

(5)RabbitMQ HA

(5)RabbitMQ HA

从小云到大云的需求演变

计算节点上的关键服务意外退出:业务虚拟机的健康运行离不开计算主机上必要的虚拟网络设施以及后端分布式存储。负责维护这些资源的关键服务如果发生异常退出,将会引起业务虚拟机死机或网络中断,从而导致服务的不可用。

(6)MySQL HA

(6)MySQL HA

OpenStack是当前最流行的云架构开源项目,逐渐成为高速发展企业和成熟企业IT基础架构的首选解决方案。IDC发布的《2018年SDC市场报告》显示,政府、通信和媒体、金融占据2018年国内OpenStack市场收入前三位,占整体市场份额67%。

计算节点宕机:在发生主机掉电或者硬件故障时,如果没有精准的宕机感知机制来获取意外的发生,且没有自动修复机制,将导致运行在其上的虚拟机全部宕机,最终导致虚拟机上运行的大量应用服务不可用,直接导致业务中断,会给企业带来无法估量的损失。

99696大富豪棋牌, 

 

随着IT基础设施持续云化,“大云”需求涌现。在大型用户的OpenStack实践中,普遍面临的问题是随着内外部用户数量的增长,单一应用和服务的规模变得愈发庞大,可能需要同时部署数百甚至数千台虚拟机。

ICOS集群HA管理服务实现全方位高可用

1. 基础知识

1. Pacemaker

如果使用多个小规模集群构建云平台,应用和服务的跨集群部署、管理、升级会变得异常困难甚至无法实现,因此对单一集群的规模产生了更强烈的需求。

本文由99696大富豪棋牌发布于今日头条,转载请注明出处:Rocky版本的全球最大规模单一集群实践,在云环境

关键词: