导读:北京2023年8月16日 -- 8月10日,在OCP China Day 2023(开放计算中国技术峰会)上,浪潮信息重磅发布融合架构3.0原型系统,以开创性的系统架构设计实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,支持池化资源异步升级、支持细粒度多主机共享高并发存储、亚微秒级远端内存共享访问等特性,可通过软件定义实现"一套系统,N类应用"。
北京2023年8月16日 -- 8月10日,在OCP China Day 2023(开放计算中国技术峰会)上,浪潮信息重磅发布融合架构3.0原型系统,以开创性的系统架构设计实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,支持池化资源异步升级、支持细粒度多主机共享高并发存储、亚微秒级远端内存共享访问等特性,可通过软件定义实现"一套系统,N类应用"。
融合架构3.0原型系统的发布,将有望发展出一种全解耦、全池化、高可扩展、易部署、易管理的新型硬件基础架构,缓解冯·诺依曼架构瓶颈,实现软硬高度协同,加速数据中心释放数字生产力,促进数字经济发展以及与实体经济的深度融合。
多数字技术融合亟需硬件基础架构创新
当前,数字化、智能化转型已成为企业发展、科研创新和社会治理的刚性需求,也催生了云计算、大数据、人工智能等数字技术的蓬勃发展。然而,越来越多样化的应用对底层硬件资源的需求存在差异,导致使用传统架构的云、数、智、边、端等各类技术平台彼此独立,硬件资源难以共享复用,造成资源浪费的同时也使得运维管理难度激增。
同时,应用数量的增多以及应用规模的扩大,也在进一步推动数据中心向集中化、规模化发展。即便数据中心已普遍采用分布式架构,但设备间的互连网络带宽远低于主板内和设备内的互连带宽,并且网络协议复杂、层次众多,协议的转换和处理占用了大量系统资源,使得业务系统扩展性受到严重限制,需要一种可扩展性更优、易管理性更好的硬件基础架构,从而实现数据中心的轻松扩容。
此次浪潮信息发布的融合架构3.0原型系统,通过系统架构创新解耦重构服务器系统,突破性实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,可支持多种通用处理器平台与GPU、FPGA、DPU等多种异构加速单元的协同计算,并可通过软件定义实现资源协同动态调度。这种基于硬件重构技术而开发的新一代基础架构,将实现更加自由的资源随需定义,为上层软件定义系统提供更出色的灵活性,使其能够根据应用特点,以高度自动化的方式分配与重新配置硬件资源,不再受到非动态设置的硬件基础设施的限制,让数据中心内部的人工智能、科学计算、云计算、大数据等各类应用统一运行于同一架构之上,实现多技术平台融合,加速业务创新及数字化转型。
融合架构3.0原型系统颠覆传统:一套架构,N类应用
"一套架构,N类应用"是融合架构3.0原型系统的核心价值所在。一切数字化、一切智能化,实际上是物理世界和数字世界逐步深度融合的过程,需要多种多样的数字技术支撑,但不同的技术对硬件架构的要求不同,各技术平台之间很难实现资源共享复用。比如,以大模型为代表的AIGC技术需要基于海量数据集,在拥有成百上千AI加速卡的集群上对千亿级参数的AI大模型进行分布式训练,对异构算力的需求更高;科学计算要求更高的计算精度,对通用算力的需求更高;内存计算则希望让更多应用程序的数据驻留在内存之中,使得数据和算力更接近,以提高处理速率,对内存容量要求更高。但传统架构下,IT资源的扩展是以整机形态来完成的,即便用户亟需的是某种特定资源,但仍然需要为整机附带的额外资源付费,这势必增加了IT支出并造成资源闲置浪费。
融合架构3.0原型机打破了以往"以CPU为中心"的设计理念,而是从整体出发,以系统为中心,通过硬件解耦将异构计算、内存、存储等资源转变为可独立扩展的资源池,用户可以根据应用需求实现资源自由扩展。其中,内存解耦不仅实现了亚微秒级远端内存访问,并且构建出一种逻辑上可远端共享的内存资源池,让多台主机访问同一个内存池,大大提高数据交换的效率,让Spark、Hadoop和机器学习等使用分布式数据框架的应用,能够更顺畅地实现框架内各节点间的数据交换与协作,显著提升数据处理效率。同时,内存解耦解除了与主机的绑定,也能让大规模、超大规模数据中心通过减少孤置的内存来提高内存资源的利用率,实现动态内存扩展,从而降低成本支出。此外,内存池化共享还可以通过本地和远端的内存,开发更多高级数据功能,比如内存数据流动或者内存数据高可用技术等。
融合架构3.0原型系统采用整机柜形态,所有的主机与资源均通过统一的管理、散热、供电实现高度集成,整体形成一个异构高算力、I/O资源和内存资源可按需拓展,资源灵活调度分配的新型"服务器"。其中,多层次多协议整系统管理、高压直流供电和负压真空CDU液冷等创新技术的开发应用,在实现数据中心细粒度、智能化管理的同时,也极大缓解了大量使用高功耗处理器引发的"功耗墙"问题。
融合架构是浪潮信息于2014年提出的技术理念,核心在于通过硬件解耦实现资源的物理池化和动态重构,通过软件定义实现业务感知的按需资源组合与配置,满足系统的弹性伸缩和超大规模的持续扩展,实现软硬高度协同发展。浪潮信息将融合架构的发展划分为三个阶段,分别为 "服务器即计算机(Server as a Computer)" ,"机柜即计算机(Rack as a Computer)"以及最终的"数据中心即计算机(Data Center as a Computer)"。此次融合架构3.0原型系统的发布,意味着浪潮信息正向融合架构的终极目标迈进。