H20是目前中国市场上能在合法渠道上买到的用于大模型训练的最先进的英伟达芯片。
过去两年里,美国曾经三度加码对华芯片出口管制。从2022年下半年开始,无论是通过官方渠道还是特殊渠道,中国企业开始疯狂抢购英伟达等AI芯片,一张GPU售价一度飙涨至接近40万元。在2022年10月和2023年10月两次出口管制后,英伟达所有可用于大模型训练和推理的先进GPU悉数被禁,包括此前在第一次芯片管制后英伟达为中国市场特供的H/A800。
2023年底,在第二次芯片管制后,英伟达再次针对中国市场推出了三款在数据传输速度等关键性能上进一步降低的芯片:H20、L20和L2。其中,H20被认为是目前欧美企业大模型训练普遍采用的H100 阉割版,算力约只有H100的不到15%,在部分特定场景下表现甚至逊于昇腾 910B。
H20在今年一季度开始接受预订。大家了解到,H20在中国的预订仅接受大客户。各大互联网头部企业都在采购,字节跳动和阿里是采购数量较多的两家。
今年3月30日,美国升级对华芯片出口禁令,表示将对中国出口的AI半导体产品采取“逐案审查”政策规则,全面限制英伟达、AMD以及更多更先进AI芯片和半导体设备向中国销售。
尽管此次禁令主要针对英伟达此前已经在中国被禁的H800/100、A800/100等先进产品,并未影响到新的H20等特供版产品,但《财经》获得的综合信息显示,中国企业对H20等新的特供版产品的兴趣在此次禁令升级后再次下降。
原因主要有两点。
一是因为禁令升级让部分中国企业把目光再度聚焦在此前已经被禁的产品。H20算力被阉割严重,而此前囤积的英伟达产品在市场上尚有存货,和这些产品相比H20性价比极低。
alibaba被传订购了3万多块H20芯片,其并未对此做出回应。阿里云采购英伟达产品主要用在自家的云服务器上,以对外提供算力。一位阿里云相关业务人士向大家表示,目前客户更认可的仍旧是老款的英伟达系列产品。新的H20系列产品由于算力被阉割得太严重,市场对其热情不高。
多位渠道人士验证了这一说法,今年第一季度,有相当一部分此前被囤积的英伟达算力在市场上释放,且价格也有回落,一台H800的八卡服务器价格已经由去年高峰期320万元以上下探到目前的280-290万元左右。虽然价格仍旧高昂,但是供应相对充足。对比之下,如果是在非官方渠道,几乎不会有客户询问H20。
二是英伟达在中国市场正越来越面临国产芯片的挑战。
HUAWEI通常被认为是国产芯片中的头部选手。百度和科大讯飞等企业都曾公开表示采购了大量HUAWEI昇腾芯片。大家了解到,HUAWEI芯片目前和英伟达相比,在性能和生态上差距仍旧不小。除了努力提升出货量之外,HUAWEI还提供了大量的技术支撑来帮助厂商进行计算框架适配。
一位接近HUAWEI芯片人士告诉大家,910B的性价比并不见得比H20高,且还存在很多技术细节受到掣肘。HUAWEI现在的做法是,通过提高整体解决方案的性价比来增强芯片的竞争力。“虽然昇腾910B在市场上不愁卖,但是HUAWEI内部还是更在意产品的实际表现,希翼可以更好。”
一位在近期采购过HUAWEI昇腾芯片的某企业计算中心负责人告诉大家,一台搭载八卡英伟达H20的服务器目前市场价已经下探至100万人民币左右,而昇腾910B等效八卡服务器可能需要170-180万元甚至更高。他表示,具体的成交价格视需求规模和紧急程度而定。但是,媒体报道中的“HUAWEI 910B售价约12万元,其八卡服务器等效产品价格从130万元到150万元人民币起”这个报价已经滞后了,“这是新一轮管制前的价格,而在新一轮管制后,HUAWEI芯片价格有明显上涨”。
某大模型初创企业的一位技术负责人士透露,昇腾910B在市场上供不应求。尽管能采购到英伟达芯片,他们还是希翼同时能够采购到HUAWEI的算力芯片。“主要是考虑到供应的持续性问题,如果只用来自英伟达的算力,投资人就会对此有疑虑。”
此外,英伟达在今年3月又发布了新的革命性GPU产品,基于Blackwell架构的B200和GB200系列,将大模型训练算力提升了数倍,并将在今年二季度出货。之前英伟达每一次发布新品后,都会冲击到既有产品的价格。有产业链人士认为,尽管新品并不会对中国市场进行销售,但是对比之下,对中国企业而言,现有英伟达产品的技术优势就显得更不明显,H20的性价比也显得更低了。
面对这种情况,英伟达在求变。
英伟达芯片由台积电代工。一位接近台积电的行业资深人士透露,由于产能有限,英伟达过去的做法通常是优先保障欧美大客户的供应。以去年中国企业向英伟达订购特供版的H800和A800为例,尽管在2022年四季度英伟达已经推出A800,2023年初推出H800,但是对中国客户普遍到年中才交付A800;到2023年11月,也就是第二次芯片禁令正式生效之时,相当数量合法渠道订购H800仍旧未交付。
但是,H20芯片的出货节奏则明显加快。H20在今年一季度开放预订,市场称从下单到交付仅需要一个月。
产业链信息显示,由于内存容量更大,H20的生产成本高于H100。在H20推出之初,多位分析人士也曾经向大家表示,即使中国企业对新的中国特供版产品需求不高,以英伟达一贯的风格,大概率也不会对这些产品进行降价。因为英伟达产品在全世界供不应求,如果H20降价盈利空间有限,英伟达会把有限的产能投入在其他利润率高的产品上。
全世界的AI企业都在抢购英伟达。尽管瑞银的报告显示,目前英伟达的交付时间在缩短,已经从2023年末的8个至11个月缩短了一半时间,但是,英伟达CEO(首席实行官)黄仁勋近期称,英伟达现在仍旧面对市场的需求压力,目前大约1.5万-2.0万家生成式AI初创企业,都在等待成为英伟达的客户。
同时,科技巨头们也在加大采购量。根据研究机构 Counterpoint Research 的数据,2023 年全球云计算服务商的资本支出仅增长了4%。但预计2024年将激增 42%,这主要是由于美国科技巨头对人工智能基础设施的大量投资所致。
也就是说,情况已经和此前业内预想有所不同。为了维系中国市场,英伟达正在做出比过去更多的让步。
一个事实是,中国市场逐渐萎缩,对英伟达来说,此前花了大力气在中国建立起的生态优势也将会逐渐缩小。而生态的优势如果丧失了,意味着英伟达或将越来越没有可能重返中国市场。
半导体研究机构SemiAnalysis表示,英伟达必须在价格上与HUAWEI竞争,才有可能在中国市场拿到足够的订单。
研究机构IG 市场分析师 Hebe Chen表示,英伟达正在走一条微妙的路线——努力在维护中国市场和应对美国政府紧张局势之间寻找平衡。从长远来看,英伟达也应在为最不利的情况做准备。
财报显示,2023年第三财季,英伟达中国大陆收入高达40.3亿美金,环比大涨47%。出口管制规则出台后,2023年第四财季英伟达中国大陆收入仅为19.5亿美金,环比大降52%。当季,中国大陆仅占英伟达总营收的8.8%,是历史最低点。
英伟达和AI相关的数据中心业务在中国大陆的收入占比过去长期达到20%-25%。但自2023年10月起,该收入显著减少。英伟达高层此前曾表示,中国大陆在数据中心收入中的比例已降至个位数。
5月23日,英伟达公布了新一季财报,营收高达260.44亿美金,同比增长262%;净利润148.8亿美金,同比大增628%。其中,数据中心业务成绩再创历史新高。一季度营收为226亿美金。
但是,根据高管在业绩会上透露的信息,中国大陆的数据中心收入仍旧在减少。
黄仁勋表示:“大家在中国的业务比过去的水平要低得多。由于大家在技术上受到限制,现在在中国的竞争更加激烈。大家将继续尽可能为那里的客户和市场服务,尽大家所能。”