在全世界的瞩目中,英伟达交上了一份超预期的成绩单。
北京时间2月27日早间,英伟达发布了截至今年一月底的2025财年第四季度业绩报告,期内营收达到393.31亿美元,同比增长78%,高于彭博综合预期(382亿美元),也超过了该公司在上季度给出的业绩指引(375亿美元);净利润220.91亿美元,同样高于彭博综合预期(209亿美元)。
这样的业绩,足以为投资者们暂时服下一剂定心丸。
自今年年初以来,英伟达股价进入持续震荡阶段。
1月27日美股收盘,英伟达单日跌幅超过17%,市值蒸发5900亿美元,创下公司历史上单日下跌最多的记录。进入2月,英伟达股价在两周的时间里,又逐渐从116.66美元拉升到138.85美元。
透过空头与多头之间的博弈,不难看出当前市场对于 AI第一股 的估值已逐渐回归理性,至于未来究竟应该是 谨慎乐观 ,还是 盲目悲观 ,英伟达还需要回答三个问题:
随着预训练的结束,博通、Marvell等主推ASIC芯片的厂商是否会给英伟达带来挑战?
在DeepSeek的路径得到验证后,大模型公司是否会降低对英伟达GPU的依赖?
主力产品从Hooper架构演变为Blackwell架构,英伟达是否能平稳过渡?
在今早发布的财报中,英伟达对部分问题给出了答案。
稳坐钓鱼台?
毫无疑问的是,英伟达近期股价波动与DeepSeek的横空出世存在直接关系。但鉴于财报的统计范围截止至1月26日,因此后者的影响无法在本季度财报上直接体现。
对于英伟达来说,过去三个月的行业变量主要体现在两方面:AI巨头公司的资本开支变化和AISC芯片企业的挑战。
首先来说说AI巨头们在基础设施上的投资。
虽然AI带来的收入增量完全无法与资本开支增量成正比,但至少在今年上半年,海外大厂对于AI硬件的投资仍在加码。
1月底,meta在发布四季度财报后宣布,将资本开支从2024年的392.3亿美元大幅提高至600-650亿美元,重点用于AI相关业务;微软在宣布调整部分数据中心租约策略后,又明确表示未来三年将提高基础设施的投资规模。
根据Bloomberg的测算,在2025年(自然年)期间,meta、谷歌、亚马逊和微软的合计资本开支预计达到2971.95亿美元,同比增长36.8%。
这些大公司在AI硬件上的热忱,组成了英伟达本季度最坚固的基本盘。
财报显示,期内英伟达数据中心收入为356亿美元,同比增长93%,较上季度环比增长16%。
值得一提的是,本季度数据中心贡献了英伟达91%以上的营收,这个数字在去年同期和前年同期大约为80%与60%左右。
作为一个以图形显卡起家的公司,英伟达本季度在游戏业务和专业可视化业务上的营收占比合计不到8%。数据中心业务俨然已经成为支撑公司业绩的绝对支柱。
除了市场需求稳固外,外部竞争也尚未威胁英伟达的统治根基。
去年12月,博通CEO陈福阳在财报发布后的电话会议上表示,公司大客户将在2027年花费600至900美元购买博通ASIC芯片,一度让看好英伟达的资本纷纷抽离,转投博通的怀抱。
这里需要介绍下什么是ASIC芯片。与广义上的GPU相比,ASIC可以专为特定推理任务而定制,不需要像GPU那样为了适应各种不同的任务而进行频繁的配置和切换。
同时,因为ASIC芯片只包含完成特定推理任务所需的功能模块,不需要像 GPU 那样集成大量的通用功能和接口。比如在一些简单的图像识别推理应用中,ASIC芯片完全可以去掉GPU中那些用于复杂图形处理和游戏渲染的模块,从而降低芯片成本。
简单地来说,在推理任务中,ASIC芯片能使成本大幅降低。目前业内主流观点认为,在负责的大规模数据中心的推理场景下,使用ASIC芯片可以将功耗降低30%-70%;如果在边缘计算等简单数据场景中,ASIC芯片甚至可令功耗下降一个数量级。
不过,就在两周前,汇丰银行等多家机构对博通做出了重估,认为市场对于后者的业绩潜力过于乐观。
一项直接证据是,根据瑞银对125家AI公司的高管走访,有63%的受访者表示公司在用英伟达的GPU进行大模型推理,而在去年5月,这个数字不足50%,充分表明了英伟达已将GPU的价值扩展到预训练阶段之外。
本质上,英伟达CUDA生态的垄断优势依然巨大。对于那些手握数十万张卡的大公司来说,考虑到计算中心的迁移成本和迁移周期,ASIC芯片的功耗优势现阶段可能并不显著。
尽管有着上述诸多利好条件,但这并不意味着英伟达在进入2025财年后,能够高枕无忧。
一方面,英伟达的毛利率正在承压。财报显示,本季度英伟达毛利率为73%,较上季度下降3个百分点,而根据最新的业绩指引,下季度英伟达的毛利率可能会进一步收缩至70.6%。
另一方面,DeepSeek所带来的产业变革已无法忽视。
DeepSeek利好英伟达?
就在昨天,DeepSeek宣布开源DeepGEMM(通用矩阵乘法)计算库,这个核心代码仅有300行的数据库将为业内的复现工作提供有力支持。
结合25日开源的全栈通信库DeepEP,DeepSeek向全球开发者提供了优化GPU通信效率、挖掘GPU性能两个维度上的工具。
对于英伟达来说,好消息是DeepGEMM、DeepEP专为NVIDIA Hopper张量核心设计,且使用CUDA编写;不那么好的消息是,围绕在AI行业中的 算力焦虑 正被逐步瓦解。
不过,英伟达似乎还没有自乱阵脚。就在上周,黄仁勋在参加一档节目时表示,DeepSeek-R1模型令人兴奋不已,而市场对于R1的反应存在一些误解,本质上R1的发布是利好AI市场。
我认为市场对R1的反应是, 天哪,AI已经完了 。就像是R1从天而降,我们不再需要任何计算,但事实恰恰相反。
耐人寻味的是,在这一段的语境中,黄仁勋似乎用AI代指英伟达。
但还是要说,黄仁勋的表述可能并不只是 面子话 。
2月25日,英伟达宣布,开源首个基于Blackwell架构的优化方案 DeepSeek-R1-FP4。在新模型的加持下,采用Blackwell的B200达到每秒21088token的推理吞吐量,相较于H100性能提升了25倍。同时,该方案下单个token的成本下降了20倍。
能够看出,在 算力即正义 的底层逻辑被动摇后,英伟达选择了新的叙事 即软硬件协同压榨算力、降低成本,在这个框架内,Blackwell架构芯片依然是最优选择。
黄仁勋在英伟达财报中表示,市场对Blackwell芯片的需求 令人惊叹 ,因为推理AI增加了另一种扩展法则 增加训练的计算能力使模型更智能,而长时间思考的额外算力使答案更智能。
在财报后的电话会议上,英伟达首席财务官克莱特 克雷斯也在努力解释Blackwell架构芯片的市场前景, 大模型后训练实际上会增加对产品的需求,新系列芯片(Blackwell)的设计就是为了更适应这种训练方式。
本季度财报显示,2025财年第四季度英伟达共交付了110亿美元的Blackwell芯片,这是英伟达历史上最快的新产品营收拉升。
另外,克雷斯还特意强调了下,如果Blackwell增产,英伟达的利润将有所改善,并预计到2025年年底,利润率将在70%-80%区间的中部。
以此来看,短期内英伟达作为 AI卖铲人 的成色仍然不会下降。