数字化转型推动社会进入算力时代,算力需求大幅增加与目前计算系统架构的不堪重负两者之间的矛盾催化出了DPU的诞生,DPU 诞生的核心价值在于将目前主流的“以计算为中心”系统架构,转化为“以数据为中心”,从而解决现阶段的性能瓶颈凸显、架构成本显著提高等问题。未来随着“以数据为中心”的架构逐步成型落地,核心芯片 DPU 将成为继 CPU、GPU 后的“第三块主力芯片”。
2022年第二季度,头豹研究院联合弗若斯特沙利文(Frost & Sullivan,简称“沙利文”)对中国DPU市场进行了深入调研,并联合发布《2022年中国DPU市场报告》,本报告旨在分析中国DPU市场的发展现状、市场需求及发展趋势,判断中国DPU市场竞争态势,剖析当下中国DPU市场竞争与发展关键,同时围绕产品能力、市场综合能力、服务能力、生态能力以及研发能力等多维度衡量,综合评估下,在现阶段有NVIDIA、Intel、AMD和芯启源四家DPU 厂商进入领导者象限。中国 DPU 行业发展处于成长阶段,本报告对竞争主体综合竞争力的分析结论仅适用于该阶段中国DPU市场发展情况,头豹和沙利文将持续关注 DPU 行业,捕捉竞争动向。
Part 1 中国DPU发展概述
01定义与技术解析
DPU 是“以数据为中心”的新一代计算芯片
目前主流的 IT 架构是“以计算为中心”,即数据与任务的调度与管理都由 CPU 负责,这一架构之下,需要消耗 CPU 的算力进行调度与管理任务,导致上层应用业务处理能力受限。GPU、存储加速卡、网络安全加速卡等负责特定任务的芯片开始被投入应用使 IO 路径随芯片的叠加而加长,导致性能瓶颈凸显。随着摩尔定律日趋极限,CPU 性能增长的边际效用开始减缓,与此同时,数据量的爆发性增长带来显著算力需求,为真正地提升计算系统的整体性能,IT 架构需要改变为“以数据为中心”。DPU 则是为该架构而生,将成为该架构的核心芯片。DPU 的网络、安全、存储卸载及数据集中处理与调度等功能,不仅能够缩短数据所需经过的路径、减轻 CPU 负担,释放 CPU 处理上层应用的能力,还能在提高数据处理效能的同时,降低其他计算芯片性能损耗,最终显著提升计算系统整体性能。同时,DPU在云计算、金融、通信等领域的厂商已开始应用或逐步投入应用,行业发展的确定性显著。通过软件定义技术灵活地实现存储、安全等功能,DPU 拥有渗透众多领域的巨大潜力。
DPU同时具有软件层与硬件层的能力支撑
良好的软件适配能力使 DPU 能够与其他处理器进行协同开发以及满足实际业务场景需求,是充分发挥 DPU 效能与释放其潜力的重中之重;而硬件层则是支撑 DPU 性能与高度可编程性的基础,通过集成多个同种类或不同种类的处理器核,DPU 能够满足大量不同类型的数据与业务处理,并具备高度可编程性,从而满足不同实际应用的设计与开发及迭代需求。
DPU 特征在于高度可编程性
DPU 配置多个处理器核,能够完全卸载网络、存储、安全等功能,并能够基于其高度可编程性,通过软件定义,灵活地对 DPU 按需调用或调整功能,降低频繁更换器件所带来的成本。在使用 DPU 的系统架构中,主机中的 DPU 与 CPU 系统分开运作,关于数据的底层功能与对应功能的加速都交由 DPU 负责,CPU 的算力则能够完全释放,完全专注于上层应用,实现将过去以 CPU 为中心的系统架构改变为以 DPU 为中心,充分提高系统整体性能。
生态是 DPU 实现软件适配的起点,也是推进 DPU 长远发展的关键
在 IT 领域,生态主要指开源生态,是驱动产品与技术不断发展与满足客户需求的重要一环。而针对同时拥有软件与硬件属性的 DPU 的发展而言,生态的内涵应更为广阔与完整,主要包含纵向与横向两个维度的生态。纵向的生态,包含产品从研发、生产到符合终端应用适配性要求所涉及到的环节,主要包括软件生态与产业链生态;横向的协同生态具体表现形式则为 DPU 产品与其它芯片产品的适配性,目前产业内主要分为通过厂商间合作,加强产品之间的适配性,从而提供多样化的高集成产品或形成适配产品推荐的销售模式的开放的协同生态,以及 DPU 厂商利用自身产品进行集成或搭配销售和封闭的协同生态。
02 发展阶段
将 DPU 商用能力具象化是 DPU 1.0 阶段的关键
DPU 1.0 阶段是 DPU 经过一系列产品定义、导入与验证,从而让 DPU 商业化落地的阶段。在这阶段过程中,芯片厂商需要与客户不断地磨合,从而加深芯片厂商对于业务的理解与加强客户对于 DPU 的认识。芯片厂商通过对 DPU 的软硬件不断地进行改进,如封装通用功能与加强可编程性,从而满足终端应用的需求,形成成熟的产品与商用能力。由于整个阶段所需消耗的资源较多,包括人力与资金等,因此,芯片厂商在这个阶段一般先锚定单一应用领域进行产品与商用模式的打磨。该阶段芯片厂商能力体现在于公司获客的进度与产品在锚定应用领域的渗透情况。
DPU 具备多应用领域拓展能力,在2.0阶段将不断向其他应用领域延伸
经过 1.0 阶段的发展之后, DPU 概念开始具象化,产品在成熟领域商用能力提升。基于商用能力提升所带来的技术突破与终端应用理解的加深,芯片厂商拓展其他应用领域的能力显著加强,从而推动 DPU 行业向多个应用领域进行渗透,提高应用领域的覆盖度,持续扩展 DPU 市场规模容量。芯片厂商在该阶段发展的能力主要体现于:厂商在 1.0 阶段取得的进展,若厂商未形成客户深度绑定,则可能因为产品未被市场验证、技术积累较弱而被淘汰;适合多应用场景的产品线,基于技术与应用场景的累积,公司可形成可靠的多应用场景产品线,这是满足现有与潜在的众多应用领域客户需求的关键。
03 未来发展趋势
实现系统级改变是 DPU 的关键价值所在
DPU 诞生的意义在于将系统架构转移至“以数据为中心”,基于其功能特点及在系统架构中的定位,DPU 未来将成为不同关键场景中的核心芯片。在使用 DPU 的系统架构中,DPU 是一个独立的子系统,与主机 CPU 分隔,并配置在网络接入口,负责 CPU 不擅长的网络数据处理,应对日益提高的数据负载,完成数据处理调度、IO 加速,同时,基于高度可编程能力灵活调用底层功能,DPU 可满足不同关键场景的需求,比如说,在计算场景中,能够缩短 IO 路径、提高数据处理效能,从而打破性能瓶颈;在存储场景中,在网络带宽、传输效率持续提高的趋势下,可助力实现计算与存储能够实现分离,从而克服计算与存储耦合带来的扩展困难、弹性低、成本高等问题。未来以 DPU 为中心的架构将逐步成型落地,以此来解决以 CPU 为中心所带来的性能瓶颈与应对业务所带来的需求,届时,DPU 将成为继 CPU、GPU 后的“第三块主力芯片”。
Part 2 中国DPU市场洞察
01 市场需求分析
面向云时代需求,DPU 解决方案应运而生
在云时代,数据中心的每一台服务器和交换机都运行独立的堆栈,这些分布式的堆栈使得整个数据中心组成了一个完全池化的超级仓储计算机。每台服务器运行的复杂的、分层的系统,CPU 性能瓶颈使其不堪重负,且在这样的趋势下,运行在每台服务器的底层工作负载越来越趋同。 面对这样的行业痛点,DPU 解决方案能将这些规模庞大的、性能敏感的通用任务进行集中卸载、处理、调度,优化系统数据处理的效能。
DPU 解决方案主要应用于三类基础设施任务的卸载:网络、存储和安全。
网络类任务加速:网络类任务在云场景中,主要是用于租户隔离的虚拟网络,网络类的任务处理非常消耗 CPU 资源,因此需要硬件加速;存储类任务加速:需要支持本地存储和远程分布式存储,集成存储客户端相关处理逻辑,存储对性能和延迟敏感,需要高性能网络和存储处理加速;安全类任务加速:安全是多方面的,网络安全类场景和存储数据安全也是安全的范畴,此外还包含业务虚机权限保护、可信根和隐私计算等。
02 行业发展关键
成功的产品定义是实现商业化的起点。
产品定义是指 DPU 厂商在对自身战略定位与市场规划有清晰的认识的同时,根据下游的用户需求,结合自身技术、生态资源储备设计出相应的 DPU 产品或解决方案。目前众多芯片公司虽在芯片方面有丰富的技术与经验积累,但由于市场定位不明确、需求解读不清晰等诸多原因,导致自身产品商业化进度不及预期。以云计算厂商为例,云原生与边缘计算的发展迫使其需要更具性价比、支持业务差异化、支持软件服务迭代的新一代硬件平台,但目前市场上尚无成熟的产品能够满足,部分云计算厂商也走上自研 DPU 的道路。因此在此阶段做好产品定义的 DPU 厂商,能够率先实现产品的适配验证,抢占市场先机。
通过增强功能覆盖更多场景
DPU 具有渗透多领域的潜力,为了实现更多功能的支持,需要有新的芯片设计来丰富 DPU 产品矩阵。目前大多芯片的设计规模和板级多芯片协同的功能划分,都是基于现有工艺下的面积与晶体管规模约束形成。而Chiplet 方式允许厂商根据功能需求对不同的功能单元,应用不同的工艺节点,并实现共同封装。促进 Chiplet 形成的 UCIe 的行业互连标准的推出,也实现了小芯片之间的封装级互连,使得 CPU、GPU、DPU 的功能相互渗透、相互集成,大大提升系统的性能和资源效率,Chiplet 也将成为 DPU 实现功能增强的重要手段。
通过通用可编程能力应对业务与环境的差异性
同时芯片公司提供“通用”的硬件平台,能够让用户通过编程的方式实现业务差异化。通过软件编程,用户可以实现想要的任何网络协议和功能的支持,以及一些用户自定义协议,实现业务创新。提高 DPU 通用能力的核心手段是形成统一标准,开源则是核心驱动力。业务场景中存在众多技术标准与体系,需要 DPU 进行针对性的适配。与此同时,由于所需要容纳的技术也较为广泛,导致 DPU 软件生态复杂。因此建立统一标准以简化软件生态,使软件生态更为繁荣成为 DPU 发展的关键,而通过建立开放社区化、具有标准接口的开源平台,用户可以更容易地通过可编程能力实现业务的自适应性,开源成为提升通用能力的核心驱动。
03厂商竞争的关键
产品需符合需求、市场进展反映发展能力、生态是 DPU 厂商的发展关键
产品是指产品定义的精准度与产品能力的强弱,是厂商竞争的核心;市场是指 DPU厂商在行业不同阶段发展情况的体现,既反映厂商渗透市场的进度,也能通过厂商获得客户的进度与涉及领域的情况,体现出厂商技术积累深厚程度;生态是指在横向及纵向生态的繁荣度以及参与积极度,对厂商的产品与市场存在深厚影响。
Part 3 中国DPU市场竞争态势
纵观2022年DPU 行业发展概况,中国DPU市场发展处于成长期,本报告分别通过市场增长指数与创新指数两大主要维度衡量业内优秀厂商竞争实力。增长指数衡量竞争主体在产品能力、市场综合能力和服务能力方面的竞争力,而创新指数则衡量DPU厂家的生态能力以及研发能力。综合评估下,在现阶段NVIDIA、Intel、AMD和芯启源四家DPU 厂商进入领导者象限。目前来说,中国DPU市场中国际芯片巨头的影响力更甚。但不同于CPU、GPU 等其他大芯片领域,中国厂商与国际龙头存在数十年的差距,在DPU 领域海内外厂商的相对差距较小。在国产化趋势下,有望能有更多的中国厂商实现突围,成为中国乃至国际DPU 行业的领导者。头豹和沙利文将持续关注 DPU 行业,捕捉竞争动向。