英伟达的“狙击者”

出品|虎嗅科技组
作家|陈伊凡
裁剪|苗正卿
头图|视觉中国
在 AI 芯片领域,英伟达凭借渊博的磨砺芯片性能紧紧占据市集霸主地位,短期内难逢对手。可是,跟着 AI 推理市集的爆发式增长,这块利润惊东谈主的 “蛋糕” 勾引了无边科技巨头与初创公司入局。
Rivos是其中一个。8月13日,这家位于好意思国加州的初创公司被曝正在寻求一笔4亿好意思元到5亿好意思元的融资。如果这笔融资敲定,那么Rivos自其2021年建造以来,融资总金额将向上8.7亿好意思元,亦然迄今死心尚未大鸿沟量产,却获取最大融资额的芯片初创公司之一。而这家芯片公司的背后投资者之一,是英特尔首席实行官陈立武。
这些初创公司和科技巨头,为何遴荐从推理侧狙击英伟达?它们又怎样凭借各异化时期与成本上风撕开把持缺口?
在东谈主工智能的天下里,磨砺与推理犹如驱动行业发展的双引擎,共同塑造着时期演进与市集竞争的面貌。
磨砺,堪称 AI 系统的 “发蒙老师” 阶段。它如同培育一个懵懂孩童,通过海量数据投喂与高强度的算法磨砺,让 AI 模子从一无所知成长为好像应答复杂任务的 “智能体”。这一历程不仅成本漂后,时时需要渊博的算力因循与大齐资金干涉。这个历程耗时漫长,一次齐全的磨砺周期可能长达数月致使数年。更关节的是,它具有彰着的一次性特征,每一次磨砺齐是全新的探索,难以复用。
而推理,则是 AI 时期的 “实战把持” 才略。当 AI 模子完成磨砺、麇集了弥散的学问后,推理便肃穆将这些学问滚动为骨子坐褥力,用于科罚试验天下中的各种问题。
在生成式 AI 期间,时期架构迎来瑕疵变革。以 Transformer 为代表的AI架构,让基础模子磨砺趋向成见和固化。就像搭建好一座坚固的大厦,后续只需进行局部修缮与优化,无需频烦躁建,极大裁减了重叠磨砺的成本。在这种情况下,推理成为捏续创造价值的关节,如同永遏抑歇的坐褥线,连续调用模子才略,骄矜不同的场景和干事。
从生意视角看,磨砺阶段如同高风险的 “成本赌局”。大齐的研发干涉与漫长的报恩周期,使得只须少数科技巨头具备入场阅历,且干涉产出比充满不细目性。
而推理阶段则白云苍狗,成为 AI 产业的 “现款印钞机”。广为东谈主知的 AI 把持,无一不是通过向用户收取推理干事费扫尾盈利。
凭据第三方机构Verified Market Research的数据,AI推理芯片市集正在经历爆发式增长,2023年市集鸿沟为158亿好意思元,展望到2030年鸿沟将达到906亿好意思元。
市集需求与生意收入在此酿成良性轮回,推理需求越昌盛,企业营收越高,进而勾引更多资源干涉,鼓励时期迭代升级。这也不难知晓,为何英伟达数据中心 40% 的收入齐源自推理业务。
推理成本的大幅着落是市集增长的最主要驱能源之一,凭据斯坦福大学2025年AI指数陈说,在短短18个月内,AI推理成本从每百万token 20好意思元暴跌至0.07好意思元,着落了280倍。硬件层面,企业AI硬件成本每年着落30%,能源效果每年栽植40%。
算法优化时期如量化、疏淡化和蒸馏等显贵裁减了模子的推断打算复杂度和内存需求。有资深投资东谈主就曾向虎嗅暗示,当今灵验的互联网数据存量也曾被使用得差未几了,它的更新是有限的,最终的增长校服是推理,推理是要把磨砺好的模子把持到不同的场景。再加上MOE(各人夹杂模子架构)出现,关于新的信息,只需要局部磨砺。是以最终爆发的市集校服是推理,推理是要把磨砺好的模子把持到不同的场景。
摩根士丹利近期发布的一份深度陈说,通过构建考究的财务模子,揭示AI推理工场的惊东谈主利润,将 AI 推理工场的盈利密码层层解开。
以 100 兆瓦电力蹧跶为标尺,涵盖基建、硬件与运营的全成本核算涌现,不管罗致哪家巨头的芯片决议,AI 推理工场的平均利润率竟普遍冲破 50%。其中,英伟达 GB200 以 77.6% 的 “恐怖” 利润率笑傲群雄,尽管其搭载 72颗GB200芯片和NVL72系统售价高达300万好意思元,但超高的利润报恩,仍让科技巨头们“眼红”。
“生成式AI期间,只须英伟达赚到钱了。”一位算法东谈主士告诉虎嗅。
推理,是一份不错测算得出来的生意。当磨砺端已被英伟达铁壁铜墙紧紧稳住,推理,反而具备了冲破英伟达的可能性。推理对生态和性能的条款莫得磨砺刻毒,重心是性价比,也即是成本低,关节的是推理的暴利。
“寰宇苦英伟达已久。”主要来自对英伟达CUDA生态的依赖,但推理关于CUDA生态系统的依赖频频比磨砺小一些。原因是,部署生动性,因为推理阶段不错使用更种种化的硬件和软件平台,包括CPU、边缘开导、WebGPU等,而不一定需要英伟达的CUDA环境,另外,磨砺历程需要巨额的矩阵运算、梯度推断打算和反向传播,这些操作在CUDA上有高度优化的扫尾;而推理只需要前向传播,推断打算量相对较小。
因此,科技巨头遴荐在推理端缓缓渗入英伟达雄霸的市集。
比如说,凭据The Information报谈,为了减少对英伟达的依赖,AWS向其客户倾销租用自研推理芯片——Trainium提供支捏的干事器,并提供了25%的扣头,这个干事器提供的推断打算才略与英伟达的H100芯片终点。
虎嗅从硅谷科技公司东谈主士、AWS的客户处获知,现时这款干事还莫得在AWS的客户中强横推论,主如若针对Anthropic,2023年亚马逊告示向这家东谈主工智能初创公司投资40亿好意思元并获取部分股权。Anthropic发布Claude系列模子,使其置身寰球头部最初模子公司行列。
本年6月,OpenAI也运转通过租用谷歌的TPU,裁减推理推断打算的成本以及在推理侧对英伟达的依赖。
尽管,业内东谈主士暗示这并不是一蹴而就的历程,致使现阶段这个举动从外界看来仅仅“隔靴抓痒”,生态依然是最大的问题,这触及背后一扫数这个词软件栈的适配,但关于这些科技巨头而言,这照实不得不运转作念的一件事——没东谈主但愿我方的钱齐被英伟达挣了。
在 AI 推理市集的利润盛宴中,科技巨头的博弈仅仅冰山一角,一众初创公司更是捋臂张拳,试图分一杯羹。
跟着东谈主工智能推理迈入高档学习和决策阶段,对算力的需求呈现出多元化、考究化的特色,通用 GPU 的生动性上风不再是惟一遴荐,新兴的芯片初创公司独辟途径,聚焦 AI 专用芯片(ASIC)的研发。相较于通用 GPU,ASIC 以更低的成本扫尾高效运算,尽管把持场景相对单一,但其在特定推理任务中的超卓性能,成为初创公司撬动市集的支点。
在这场初创势力的解围战中,Rivos 无疑是备受瞩主见 “黑马”。从戴尔、台积电到英特尔、联发科,无边行业巨头纷繁为其注资。据The Information征引知情东谈主士的话,Rivos正在开发软件,该软件不错将英伟达的CUDA软件代码,翻译成在Rivos的说话,在其芯片上高效运转。这意味着其芯片可无缝相连英伟达生态的软件资源,极大裁减用户搬动成本。
除了Rivos,另一家英伟达的挑战者Groq也在筹集资金。
虎嗅凭据公开信息以及The Information上公布的东谈主工智能芯片初创公司的名单,25家英伟达的挑战者,一共从投资者那处筹集了向上70亿好意思元的资金,总估值达到290亿好意思元。
初创芯片公司Groq由前谷歌TPU团队成员建造,开发了私有的说话处理单位(Language Processing Unit)架构,这是其最大的时期各异化上风,有利针对AI推理任务进行了优化,堪称能提供“天下最快推理”性能。Groq提供了远低于传统GPU的token处理成本的科罚决议,这使其在推理市集具有彰着的经济上风。如今,Groq已从贝莱德、想科、三星等处累计筹集向上10亿好意思元,并与沙特阿拉伯达成了价值15亿好意思元的芯片协作条约,在英伟达渗入率还不算高的中东市集运转拓展我方的芯片生意。
Groq的CEO在一次播客采访中也暗示,英伟达不错制造他们原来要制造的每一个GPU,并将其用于高利润的磨砺业务,而他们则不错接办低利润但高体量的推理业务。
还有的场地是英伟达的视野尚未看到的眇小旯旮——比如一些边缘侧,袖珍漫衍的推理需求正悄然爆发。举例从智能家居开导到智能衣服居品,AI 智能硬件的强横把持催生海量边缘推理场景。
此外,一些新式算法架构以及与之相结合所开发的芯片正在出身。在夙昔几年里,英伟达是“算力越大越好”(Scaling Law)叙事下,最大的受益者,其依靠这套暴力好意思学,兜销其GPU。
仅仅Scaling Law到底是不是真确通往通用东谈主工智能的谈路?并莫得定论,起码Meta首席东谈主工智能科学家杨立昆(Yann LeCun),并不这样以为,“咱们不成使用像 ChatGPT 或 GPT4这样的时期来磨砺机器东谈主计帐桌子或者填满洗碗机,即使这对一个孩子来说是一件微不及谈的任务,咱们如故作念不到。”
关于在生成式AI期间处于十足把持地位的英伟达而言,GPU的“越多算力越好”的故事还能说多久,不好说,科技界恒久在演出颠覆与被颠覆的故事。

株连裁剪:杨赐