全文字数:1753字,精读时间:4分钟
本文援引于报告《2021年中国数据处理器行业概览系列短报告(二):数据处理器在数通市场的应用》,首发于头豹科技创新网(www.leadleo.com)。
头豹科技创新网内容覆盖全行业、深入垂直领域,行业报告每日更新;政策图录、数据工具助您轻松了解市场动态;智能关键词轻松搜索,直奔行业热点内容。
诚挚欢迎各界精英交流合作,头豹承接行业研究、市场调研、产业规划、企业研究、商业计划、战略规划等业务,您可发送邮件或来电咨询。
客服邮箱:CS@leadleo.com 咨询热线:400-072-5588
100G时代降临,数据处理器助力CPU突破算力瓶颈
在云计算时代,虚拟交换(Open Virtual switch,OVS)等网络功能虚拟化将占用更多的CPU资源。尤其是当吞吐增大时,为保证转发质量,虚拟交换机(vSwitch)通常会绑定多个CPU核,这会额外占用大量CPU资源,增加企业运行成本和能源消耗。此外,通过CPU访问内存、进行数据搬移的开销在多数应用中占据了极大的比例,如在快速傅里叶变换(fastFourier transform, FFT)计算中,数据搬移占据了40%的开销。数据处理器的出现可减轻主机端CPU的网络堆栈计算负载,包括虚拟交换(OVS)、存储(RDMA)、数据(TCP/IP)和网络加密(IPSEC/SSL)等。数据处理器产品形态、结构以及主要功能多样,但背后的理念相同,即分担CPU的负荷,释放CPU的算力,让CPU的算力更高效地应用在业务数据的处理上,从而减少算力成本。
数据处理器种类繁多,在性能、成本以及可编程性上有显著差距
随着数据处理器可应用在数据传输、虚拟交换、数据安全以及存储多个场景,对核心处理器的可编程性要求较高。按核心处理器分类,数据处理器分为3类,包括FPGA、MP与ASIC。三类数据处理器性能、成本以及可编程性有较大的不同,满足用户差异化的需求。
基于FPGA设计的数据处理器,具备丰富的逻辑单元实现对数据快速的并行处理,并且引入较小的能耗开销。FPGA对应的硬件编程语言在编程复杂度上较繁琐,需要高效的编程框架(如ClickNP)支持。其次,FPGA的价格昂贵,在数据中心中大量部署的成本较高。
基于MP设计的数据处理器,多数使用片上系统(System on Chip,SoC)的实现方案,使用的处理器核可以是网络处理器(Network Processor,NP)或通用处理器(General Processor,GP)。在性能方面,基于NP-SoC的数据处理器较GP-SoC稍占优势,主要原因系NP并行数据处理速度领先GP,但两者的性能均不及基于FPGA的性能。在编程方面,基于NP-SoC的编程复杂度居于FPGA和GP-SoC之间,而GP-SoC的数据处理器可编程性最强。
基于ASIC的数据处理器,可满足多数通用网络处理的应用场景,可在预定义的范围内对数据平面进行可编程处理,并提供有限范围内的硬件加速支持,如批量使用,在性价比上有较大优势。基于ASIC的数据处理器性能最强但可编程性最差,在成熟的应用场景可发挥算力优势,但缺乏可编程的灵活性将限制其在新应用场景的渗透。当前,业界部分厂商推出基于“ASIC+GP”的数据处理器,例如Mellanox(被英伟达收购)的BlueField系列,解决ASIC可编程性不足以及GP性能不足的,寻求灵活性与性能之间平衡点。
裸金属服务器是数据处理器在云计算领域的刚需
云计算厂商主要通过虚拟服务器向用户提供弹性算力。虚拟服务器在灵活性上优于物理服务器,但在性能与可靠性上有明显的不足,难以提供高算力。在此背景下,裸金属服务器结合了虚拟服务器弹性算力与物理机高计算性能的优势。裸金属服务器的本质仍是物理服务器,用户通过租用的方式获得裸金属服务的计算资源。
裸金属服务器发送的是裸报文,不具备报文封装与解封装的功能,而云计算厂商无权在用户租用的裸金属服务器上部署报文数据处理相关功能,因此只能在云计算数据中心中部署大量网关服务器用于处理裸金属服务器发送的裸报文,成本较高。为降低成本,云计算厂商在裸金属服务器中安装数据处理器,用于处理报文的封装、解封装与转发。数据处理器可替代网关服务器处理裸报文,既不会占用裸金属服务器的CPU核,亦可降低云计算厂商购买网关服务器的成本。目前,中国云计算厂商(包括华为、BAT)裸金属服务器均配置了数据处理器。数据处理器已然成为了裸金属服务场景下的刚需。
数据处理器成本高,导致渗透率较低
从数据处理器成本端分析,客户购买数据处理器的成本在7,000-8,000元之间。从收益分析,客户使用数据处理器,可节省主控CPU 3-4个核。最新一代英特尔至强CPU 28核在2万6元左右,意味着CPU单核的经济价值为928元)。客户使用数据处理器带来的经济价值(节约CPU 4核的成本)仅在3,715元左右。因此从经济层面来看,数据处理器价格昂贵,高出自身的内在价值,导致数据处理器渗透率极低。2020年,英伟达在中国共出售了1百万张网卡,其中仅有1,000张数据处理器,渗透率不足千分之一。
提升渗透率有两条思路:(1)降本,数据处理器售价降到3,000元左右;(2)提升性能,节省CPU核数数量超过10,则节省的硬件成本超过9,000元,数据处理器的经济价值才得以体现。此外,客户配置数据处理器还会产生隐性成本,例如组建数据处理器的运维团队以及服务器网卡的置换成本。若考虑隐性成本,客户服务器数量至少超过10万架,数据处理器的经济价值才会被放大。
重点关注企业
通过深度研究中国DPU行业内优质企业,头豹建议重点云豹智能、芯启源、中科驭数。