三年前,当ZStack 创始人&CEO 张鑫得知阿里云要推出弹性裸金属服务器(又称“神龙裸金属”)时异常激动,这是他期待已久的智能服务器,兼具“虚拟机的心脏”和“物理机的肌肉”。

而这也是区别于第一代裸金属的“真正”弹性裸金属技术——让服务器在云平台中有跟虚拟化一样的使用体验,可以像虚拟化一样使用云平台的所有功能。如果将这些功能比作衣服,基于弹性裸金属技术的神龙就是穿上衣服还可以根据不同场景换装的智能裸金属。

当拥有弹性裸金属技术的神龙服务器在阿里公共云上线后,一直致力于将公有云中成熟的技术带给私有云用户的ZStack就立了Flag:一定要想办法把它带到私有云中,因为私有云用户的个性化场景和应用需求更需要弹性裸金属技术。

但神龙是在阿里云自研的飞天云平台底下诞生、面向飞天云平台的服务器,经过两年的对接,ZStack研发团队和神龙团队在2020年实现了这个目标:基于弹性裸金属技术的神龙私有云——神龙服务器+ZStack正式上市,并已获得众多落地用户的认可。

对于私有云用户来说,神龙私有云能够帮助他们以极低成本畅享公有云过去十年的发展成果,这是2020年最酷的一件事,也应该是目前全世界范围内门槛最低的裸金属解决方案。

弹性裸金属的新价值 裸金属并非新词。第一代裸金属技术的历史甚至比虚拟化更早,毕竟在没有虚拟化技术前,人们仍然需要管理数据中心。但裸金属的再度流行,与整个云计算行业发展所带来的用户需求及市场变化等因素紧密相关。

商业模式的演进推动了企业需求在云计算时代的不断演变。公有云提供了极富吸引力的弹性优势,它综合了租用传统服务器的稳定性与使用云上资源的高度弹性两大优势,用户可以快速自助申请创建并管理裸金属服务器物理集群。

时光倒回三年前,阿里云发布了融合物理机和虚拟机特性的“跨界”云服务器——弹性裸金属服务器,它采用了自主研发的软硬协同虚拟化架构神龙(X-Dragon),被称为云计算领域的新物种。

在张鑫看来,弹性裸金属和传统裸金属最明显的分水岭,在于SDN、NFV、分布式存储等功能,在传统裸金属的条件下这些几乎无法使用,或者使用成本和代价都很高;而弹性裸金属的价值,就是要让物理服务器像虚拟化一样便捷、低成本的使用云平台的所有功能。

神龙服务器就是延续虚拟化的思路,通过软硬件一体化的设计实现弹性裸金属技术,将云计算的基础设施带到一个全新的层面上,再从虚拟化的角度重新定义云计算基础设施:一是操作系统独占物理服务器;二是在网络和存储方面,像虚拟化一样具有“隔离”的功能。

据阿里云神龙产品负责人王志坤介绍,操作系统独享服务器上的所有硬件,无论是CPU、内存,还是GPU、本地磁盘等,都可以直接使用访问,性能损失为0。

阿里云在其经典的《神龙首次开箱直播评测》中直播过阿里云自研的特殊硬件——神龙芯片,其拥有独立的处理、存储、IO等单元,神龙芯片承担了原来通过软件才能实现的网络、存储以及外围设备等虚拟化功能。

在这样的架构下,每台神龙服务器,在云平台中使用裸金属的体验,跟使用虚拟机是完全一样的。但是由于这种调用是通过硬件来实现的,所以基本没有性能开销,整个机器的运行性能和裸机无异。

这就意味着,拥有弹性裸金属技术的神龙服务器,在保证产品性能无损的同时,更提供了一种按需购买、按量计费、像云主机一样便捷的计算资源服务。

降低私有云部署门槛 在企业上云过程中,对性能、稳定性和安全性有着诸多考虑。企业原有的核心应用需适配虚拟机进行调整,但是核心数据库业务对高性能的要求又给虚拟机带来了巨大的挑战。

裸金属服务器的出现,恰到好处地解决了这一瓶颈问题,不仅为用户提供超高稳定的算力,而且大幅度降低运维成本,进行资源的最优化配置,助力企业加速数字化转型进程。

神龙服务器诞生之初是服务于阿里公共云的,一定要跟云平台结合才能形成完整的裸金属方案。经过3年多沉淀,神龙服务器目前已经服务了大量公有云用户,并且在阿里巴巴集团内部的新服务器已经all on 神龙。

如果是私有云和混合云用户,要获得神龙的弹性裸金属方案,起步规模较大,相应的门槛较高。为了让私有云和混合云用户能够以低门槛与低成本使用神龙的弹性裸金属方案,阿里云神龙团队携手ZStack研发团队,开启了联合开发之路。

ZStack 创始人&CEO 张鑫

对于ZStack来讲,神龙相当于一种新型的虚拟化技术,具有自己独特的编程接口。目前ZStack可以管理KVM和VMware两种虚拟化技术,不同于这两种虚拟化技术的是,支持神龙服务器需要在ZStack和神龙服务器两方都做出改变。

这些改变主要集中在网络和存储,神龙服务器要使用ZStack提供的网络和存储功能,需要在神龙芯片中实现所有的网络和存储北向接口。经历一年的联合创新,双方都打通了网络和存储接口,并在2020年6月正式对外发布了基于弹性裸金属技术的神龙私有云。

至此,ZStack丰富的云平台功能都能在神龙服务器上使用。由于裸金属实例本质是物理服务器,用户还可以通过ZStack创建出神龙实例后,将其当做普通物理机再添加到ZStack中,并在其上再次创建虚拟机,按照需求实现“虚拟机与物理机嵌套”的特别功能;也可以通过预先制作好的镜像快速部署容器集群,从而打开更为丰富的使用场景。

采用神龙私有云后,用户IT环境中的物理机服务器不再是传统的服务器,而是可以通过ZStack部署、销毁、控制的智能服务器,不仅能够直接部署业务应用,也可以当做承载虚拟机的物理机使用。

这一切既可通过ZStack UI界面操作,也可以通过ZStack API接口控制,让服务器从人工操作手动时代进入到了可编程、自动化时代。

神龙私有云已经拥有不少落地案例,其中最大规模的已经部署了数百台神龙服务器,使用两台物理机安装ZStack软件,就能够管控数百台至数千台神龙服务器,获得完整的云平台功能。

为五类场景铺就上云高速公路 相较于公有云,私有云对裸金属主机一般都有着一些特殊的要求:要么用来部署高IO性能的应用;要么用来运行无法虚拟化的业务;要么用来处理高性能运算,私有云里的裸金属更能提供个性化服务,以满足各类用户在不同场景中的应用需求。

为了让用户拥有专属的裸金属服务器,并能针对大数据、高性能计算、高内存需求、信创等场景提供灵活弹性服务,神龙私有云针对以下五类场景铺就了一条最为便捷的上云高速公路。

比如在大数据场景中,大数据平台对CPU、内存、能耗的要求都非常高,在虚机环境下的性能波动往往会影响其工作效果。但如果把应用直接跑在神龙私有云上,就能提供更大的带宽来应对大数据存储的高要求。这样一来,既能通过云平台的功能大大简化大数据集群的部署复杂程度,又能保证其运行时的性能,在业务量较大的情况下,使用裸金属服务器的成本会大大降低。

在高性能计算的关键场景中,云与超算之间的基本矛盾在于虚拟化损耗,云服务器都是虚拟机,在云上部署超算集群不经济,因为有约10%的CPU要用于虚拟化,导致性能损耗。如今神龙私有云的推出,就解决了这一矛盾。

在容器场景中,国内很多用户希望直接将容器部署在物理机上,以获得最大的性能优势,但同时又希望享受云平台提供的网络和存储能力,神龙私有云就为满足这个诉求提供了最优解决方案。

而对虚拟化支持效果不理想的应用来说,通过神龙私有云,也能让这些无法迁移到虚拟化环境的应用实现了云化,从而使用云平台的高级功能。

在信创场景中,目前信创芯片对虚拟化指令的支持程度都不相同,平台在适配过程中,也存在需要将一些虚拟化组件在对应平台上重新编译并维护的问题。神龙架构对于不同平台的天然适配性,可以兼容各类国产异构物理环境,帮助传统应用、安全保密类应用,快速转型为新基建应用,用户不用大幅度改造传统系统就能实现容灾双活,并且在保证性能的同时享受云的便利。

眼下,随着新基建落地步伐的加快,云计算、大数据、AI技术不断深入传统行业。在传统业务。上云的征程中,神龙私有云解决了物理机性能与云平台便利性不可兼得的问题。

未来,基于弹性裸金属技术的神龙私有云将在具有高IO、高性能、高负荷计算等诸多行业场景中有更深度和更广泛的应用,助力更多企业实现IT系统智能升级。