半导体行业观察
在数据中心领域,英伟达除了能提供广为人知的AI芯片——GPU以外,他们在产品“百宝箱”中还能提供一系列其他的产品,为客户提供服务。例如DPU,就是其一极具竞争力的产品?所谓DPU,按照英伟达所说,是一种新型可编程处理器,集三个关键要素于一身。DPU 是一种SOC ( System On Chip ,系统单芯片),它结合了:
1 行业标准的、高效能及App可编程的多核CPU ,通常基于已应用广泛的Arm 架构,与其他的SOC 组件密切配合。
2 高效能网络界面,能以线速或网络中的可用速度解析、处理数据,并有效率地将数据传输到GPU 和CPU 。
3 各种灵活和可编程的加速引擎, 为AI 、机器学习、安全、电信和储存等应用作业负载,并提升其性能。
所有这些DPU 功能对于实现安全的、裸机的、原生云端运算的下一代云端大规模运算至关重要。
根据数据,2020年全球DPU产业市场规模达30.5亿美金,预计到2025年全球DPU产业市场规模将超过245.3亿美金,期间CAGR高达51.73%。
正因为拥有如此效能和市场前景,除了英伟达以外,不少第三方芯片供应商正在进入这个市场。例如英特尔、AMD、Marvell等知名芯片巨头。国内如云豹智能、中科驭数和云脉芯联等新兴厂商也跃跃欲试。
但与此同时,那些云厂商也纷纷入局,MicroSoft就是最新的一个。
MicroSoft,入局DPU
据the information透露,MicroSoft正在开发一款新的网卡,可以提高其Maia AI 服务器芯片的性能,并有可能减少该企业对芯片设计商Nvidia的依赖。
报道援引知情人士的话称,MicroSoft首席实行官萨蒂亚·纳德拉(Satya Nadella ) 已任命网络设备开发商瞻博网络 (Juniper Networks) 联合创始人普拉迪普·辛杜 (Pradeep Sindhu) 来领导网卡工作。
报告补充说,这款新网卡类似于 Nvidia 的 ConnectX-7 卡。
NVIDIA ConnectX-7 网卡提供最多 4 个连接端口和最高 400Gb/s 的吞吐量,可为云、电信、AI 和企业工作负载提供数据中心规模的硬件加速网络、存储、安全和管理服务。ConnectX-7 通过加速交换和数据包处理(ASAP2)、高级 RoCE、GPUDirect Storage,以及用于 TLS、IPsec 和 MACsec 加密和解密的内联硬件加速等功能,为敏捷、高性能网络解决方案提供支撑。ConnectX-7 使组织能够在高带宽和高密度环境中满足当前和未来的网络需求。
为了协调工作,组成人工智能集群的服务器需要能够共享存储在各自内存池中的数据。数据共享请求通常必须经过服务器的中央处理单元。Nvidia 的 ConnectX-7 适配器包含一种名为 RDMA 的技术,可以绕过 CPU,从而显着加快数据检索速度。
该器件还具有其他一些性能优化功能。值得注意的是,它可以实行网络安全任务,例如加密数据流量,否则这些任务将由服务器的 CPU 实行,从而为应用程序提供更多的 CPU 容量。ConnectX-7 还卸载了检测数据传输错误所涉及的一些计算。
来到MicroSoft方面,他们之前曾在一篇文章中谈到了关于DPU的使用:“SmartNIC 或数据处理单元 (DPU) 带来了加倍发挥App定义基础设施优势的机会,而无需牺牲(虚拟机)VM 或容器中的业务线应用程序所需的主机资源。借助 DPU,大家可以启用 SR-IOV,消除合成数据路径产生的主机 CPU 消耗,同时享受 SDN 的优势。随着时间的推移,大家预计 DPU 将提供更大的优势,并重新定义大家的旗舰边缘产品(例如 Azure Stack HCI)的主机架构。”
在同一篇博客中,MicroSoft以英伟达的产品为例,讲述了自己在网卡上面的一些实践与优势。而在这个产品出来以后。则是继自研AI芯片Maia之外,MicroSoft打响抛弃英伟达芯片依赖的第二枪。
对于MicroSoft来说,除了自身本来的团队以外,在去年收购的Fungible,是企业进军这个市场的另一个依仗。
Fungible,MicroSoft的底气
MicroSoft在收购Fungible的公告中说,Fungible 一家可组合基础设施提供商,旨在通过高效、低功耗的数据处理单元 (DPU) 加速数据中心的网络和存储性能。Fungible的技术有助于实现高性能、可扩展、分解、横向扩展的数据中心基础设施,并具有可靠性和安全性。
从Fungible的背景看来,这单收购对其DPU业务来说无疑是如虎添翼。知名半导体分析师Dylan Patel曾写道,Fungible 曾经是最热门的半导体初创企业之一 Fungible 是第一家针对云级 DPU 的商业芯片企业,先于英特尔、Nvidia、Pensando (AMD) 和 Marvell。
而作为一家致力于开发和构建数据处理单元(DPU) 芯片的厂商,Fungible拥有一个梦幻团队。创始人 Pradeep Sindhu 和 Bertrand Serlet 都拥有杰出的科技背景。Sindhu 是瞻博网络 (Juniper Networks) 的创始首席实行官兼董事长,然后是副董事长、首席技术官和首席科学家,后来加入了初创企业 Fungible。Serlet 曾任苹果App工程高级副总裁,之后创立了消费者云存储业务 Upthere,该企业于 2017 年被西部数据收购。在此之前,他曾担任苹果App工程高级副总裁、史蒂夫·乔布斯旗下 NeXT 的App工程总监。
Fungible 认为,DPU 可以解决数据中心效率低下的五个根本原因。所有数据中心计算均通过数据包进行。网络、存储、虚拟化和安全堆栈通过数据包进行分发。因此,有比将所有内容都转移到 x86 系统上更有效的方法来将计算和数据结合在一起并实行工作。
Fungible指出,DPU 本质上一侧是 PCIe,另一侧是以太网。对于这四个主要的超分解构建块,其DPU 提供了一个“TrueFabric”技术,允许人们将所有这些元素带入网络。对于那些具有网络背景的人来说,一切最终都会回到带有连接设备的网络,这与那些开始构建更大的 CPU 或 GPU 的人不同。
据先容,TrueFabric 是一种大规模的 IP-over-Ethernet 结构协议,可提供完整的网络横截面带宽,具有低平均和尾部延迟、端到端 QoS、无拥塞连接性以及服务器节点之间的安全性。TrueFabric协议完全符合标准,并可与以太网上的 TCP/IP 互操作,确保数据中心 SpineLeaf 网络可以采用标准离线构建架子以太网交换机。
具体到产品方面,Fungible开发了两款令人印象深刻的DPU芯片:用于存储、分析、人工智能服务器或安全设备使用的设备前端F1,以及用于裸机服务器虚拟化、节点安全、存储启动器、本地实例存储和网络网络虚拟化的基于服务器的S1。
首先看F1方面,如图所示,大家可以看到一组八个数据集群,它们被分成 8x 24 线程集群。有一个用于芯片安全和控制平面的控制集群。F1 DPU 具有 800Gbps 网络速度,例如 8x 100GbE。有 64 个 PCIe Gen3/Gen4 通道分为四个 x16 主机;数据集群基于具有SMT=4设计的MIPS内核。这意味着每个数据集群有 24 个线程,加上它们的本地缓存、加速器以及与更大芯片结构的连接。该系统具有 8GB 高速 HBM2 内存以及 DDR4 ECC 内存控制器;它还可以支撑 NVDIMM-N,这非常有趣,因为它有效地在 DPU 级别添加了持久内存功能。
来到S1方面,据先容,这是Fungible DPU系列专用处理器中的第二个设备,针对以数据为中心的计算进行了优化。作为业界最灵活的 200 Gbps DPU,S1能够比通用 CPU 更高效地实行以数据为中心的计算。S1DPU 从主机服务器中的 x86 核心完全卸载整个存储、网络、安全和虚拟化堆栈,从而释放超过 50% 的 x86 CPU 周期来运行应用程序工作负载。
Fungible表示,虽然F1 DPU 专为存储、安全、AI 和分析服务器等高性能独立设备而设计,但 S1 DPU 在标准 PCIe 适配器的占用空间和功率范围内最大限度地提高了性能。S1 先进的 SoC 架构集成了运行完全分离的控制平面和数据平面的多核处理器集群。这些集群通过快速片上网络 (NoC) 互连到精心挑选的硬件加速器块集合。SoC 通过标准以太网端口和支撑端点 (EP) SR-IOV 和 Root Complex (RC) 功能的 PCIeGen3/Gen 4 控制器与外部组件交互。
虽然开始表现惊艳,但Dylan Patel在其文章中披露,该企业从2022年8月该企业在 8 月份裁员,并在 当年11 月份缩减产品线后,放弃了其可组合基础设施的雄心,专注于DPU 增强型 NVMe/TCP 存储阵列。按照知情人士所说,之所以会出现这样的结果,是因为Fungible想要关注的(存储)市场已经被财力雄厚、产品非常成熟的成熟企业所饱和。这对他们来说将是一个挑战。
Fungible在回应媒体提问时也表示:“早在2020年,Fungible 决定通过收购和有机开发,用更高级别的可组合性App解决方案来增强其 DPU 产品组合。尽管大家尽了最大努力,但与 Fungible 基于 DPU 的存储技术所取得的成功相比,Fungible 仍无法在编排(orchestration)领域取得成功。这促使大家将工作重点放在由 Fungible DPU 实现的横向扩展存储上,并可在大家的 Fungible 存储集群解决方案中使用,以推动企业的成功。”
但最后,如Dylan Patel所说,在多方筹集资金未果之后,Fungible曾想出售给 Meta,但最终他们无法获得任何支撑。具体到MicroSoft方面,这家云巨头最初考虑与 Fungible 进行定制芯片交易,但最终决定以低价收购该企业、员工和常识产权。
于是,产生了文章开头的故事。
DPU,机会在哪里?
DPU一开始光芒四射,但随着明星新贵被收购,云巨头和芯片巨头纷纷杀入之后,其前景似乎有了更多的不确定性。如blocksandfiles在早前就透露,DPU初创企业Nebulon或已经被英伟达之前,而在Fungible之前,明星企业Mellanox被英伟达收购,AMD也拿下了Pensando。
云厂商方面,AWS其拥有内部Nitro技术;阿里云有神龙;HUAWEI也有自研DPU产品。再加上之前说到的DPU芯片厂商,由此可见,对于DPU厂商来说,留给他们的机会其实并不是太多。有消息人士表示,在他们看来,在DPU方面,可组合基础设施和其他芯片开发初创企业有三种潜在的市场途径:
1 建立可组合的基础设施企业;
2 成为其他 OEM、ODM 和云的军火商,提供组件和随附App;
3 构建一个特定的盒子,例如存储或 GPU 服务器;
Blocksandfiles在文章中也强调:
DPU 市场已被证明是一个难以攻克的难题。大型服务器供应商相对较少:戴尔、HPE、联想、超微,以及落后一些的思科。如果其中一个或多个采用您的 DPU 作为标准组件,您就有很大机会成为一般市场供应商。但从DPU 初创企业 Fungible 和 Pensando的发展看来,这并没有发生。
如果非常大的服务器买家(例如超大规模提供商)如果不直接收购业务,也可以采用供应商的 DPU(Fungible 就发生了这种情况)。MicroSoft在2020年底以1.9亿美金的价格收购了它。当这类企业被收购时,它们就成为内部系统组件供应商,而不是一般市场供应商。
此外,处理器供应商可以开发自己的DPU——Intel及其IPU;Nvidia 与 BlueField 合作,或者收购一家 DPU 初创企业,就像AMD在 2022 年 4 月以 19 亿美金收购 Pensando那样。这就使得Kalray和 Nebulon 在不愿采用的服务器 OEM 市场上难以销售 DPU 产品,而且企业也不清楚 DPU 的好处采用专有的基础设施技术,背后没有大而可信的名字。在这样的背景下,小小的芯片企业如何与 Intel、AMD、Nvidia 竞争呢?
“总而言之,一般的 DPU 市场尚未出现”,Blocksandfiles总结说。
|