ICC訊 AI訓(xùn)練領(lǐng)域的霸主英偉達(Nvidia)在平安夜前夕,通過達成一項“拆解式控制交易”(Control-through-deconstruction deal),收購了其推理加速器芯片領(lǐng)域最可信的挑戰(zhàn)者之一,以擴大自身在推理領(lǐng)域的影響力。
根據(jù)CNBC報道,英偉達動用了其600億美元現(xiàn)金儲備的三分之一,即200億美元,收購了推理技術(shù)資產(chǎn),包括首席執(zhí)行官Jonathan Ross、總裁Sunny Madra以及Groq核心工程團隊的其他成員,他們都將加入英偉達,以幫助推進和擴展所授權(quán)的技術(shù)。Groq的首席財務(wù)官Simon Edwards將出任剩余公司的CEO職位,該公司主要包括Groq新生的云業(yè)務(wù),該業(yè)務(wù)通過云API銷售對其AI加速器的訪問權(quán)限。這將防止英偉達與其超大規(guī)??蛻糁苯痈偁帲灰虼?,英偉達在沒有卷入云業(yè)務(wù)競爭的情況下,獲得了核心人才和芯片技術(shù)。
盡管這是英偉達迄今為止規(guī)模最大的交易,但它體現(xiàn)了科技界一種新型的交易方式,即留下部分資產(chǎn)和員工,而非整體收購。這留下了一個法律空殼,有助于公司規(guī)避反壟斷審查。2025年9月,英偉達曾策劃過一筆類似但規(guī)模較小的交易,當(dāng)時它支付了超過9億美元來授權(quán)Enfabrica的技術(shù),并聘請了該AI硬件初創(chuàng)公司的首席執(zhí)行官Rochan Sankar及其他員工。
盡管英偉達首席財務(wù)官Colette Kress拒絕對這筆交易發(fā)表評論,但Groq在CNBC報道后發(fā)表了一份聲明,承認已與英偉達就Groq的推理技術(shù)達成了一項非排他性授權(quán)協(xié)議。但真正的獨家消息來自于黃仁勛發(fā)送給英偉達員工的一封電子郵件,該郵件被CNBC獲取。他表示,該協(xié)議將擴展英偉達的能力。
他寫道:“我們計劃將Groq的低延遲處理器整合到英偉達 AI工廠架構(gòu)中,擴展該平臺以服務(wù)更廣泛的AI推理和實時工作負載?!? “雖然我們正在吸納優(yōu)秀員工加入我們的隊伍并授權(quán)使用Groq的知識產(chǎn)權(quán),但我們并未收購Groq公司?!?
Groq的價值主張
Groq成立于2016年,由一群前谷歌工程師創(chuàng)立,他們曾是創(chuàng)建張量處理單元團隊的成員,TPU是一種用作英偉達 GPU替代品的AI加速器芯片。除了首席執(zhí)行官Jonathan Ross,創(chuàng)始團隊還包括曾在谷歌X“登月工廠”工作的前工程師Douglas Wightman,他于2019年離開了Groq。
Groq的秘訣在于其推理處理器——語言處理單元。該處理器集成了數(shù)百兆字節(jié)的SRAM作為主要權(quán)重存儲器,而非緩存,這降低了延遲并以全速向計算單元提供數(shù)據(jù)。它專為高效的AI推理而設(shè)計,即訓(xùn)練好的AI模型進行預(yù)測或決策的過程。Groq聲稱其LPU的能效比英偉達及其主要競爭對手AMD的GPU高出多達10倍。
換句話說,Groq的LPU不使用外部高帶寬內(nèi)存芯片,使AI加速器擺脫了內(nèi)存瓶頸。此外,片上SRAM有助于加速與聊天機器人及其他AI模型的交互。這進而支持了推理過程,即已訓(xùn)練的AI模型對用戶請求作出響應(yīng)。盡管這也限制了可服務(wù)的AI模型的規(guī)模。
與擅長并行處理的CPU或GPU不同,LPU采用專為順序處理設(shè)計的單核架構(gòu),非常適合運行按順序處理信息的大語言模型等任務(wù)。
推理市場的新戰(zhàn)場
雖然英偉達主導(dǎo)著AI模型訓(xùn)練市場,但推理市場高度分散,競爭對手包括AMD和博通,以及Cerebras和Groq等初創(chuàng)公司。此外還有AWS、谷歌和微軟開發(fā)的自研推理芯片。然而,Groq尤其在高性能推理工作負載方面,作為可行的GPU替代方案獲得了越來越多的關(guān)注。
但為什么英偉達要為一家目標今年年收入5億美元、三個月前最近一輪融資時估值為69億美元的公司支付200億美元的巨額溢價呢?行業(yè)報告表明,英偉達內(nèi)部有一個團隊一直在探索非類GPU的替代架構(gòu)。
此外,黃仁勛在行業(yè)活動的重要演講中一直堅稱,隨著AI市場從訓(xùn)練轉(zhuǎn)向推理,英偉達將保持其領(lǐng)先地位。為推理技術(shù)支付200億美元,這是一個明確的信號,表明實時AI現(xiàn)在是真正的戰(zhàn)場。這也標志著推理不再僅僅是一個下游優(yōu)化問題,推理之戰(zhàn)才剛剛開始。
推理領(lǐng)域的激動時刻
這對英偉達來說是一步戰(zhàn)略棋。盡管英偉達已對多家AI芯片初創(chuàng)公司進行了投資,但這筆交易顯示了英偉達捍衛(wèi)其在AI硬件領(lǐng)域領(lǐng)導(dǎo)地位的決心。尤其是當(dāng)英偉達許多最大的客戶正在開發(fā)自己的AI處理器或探索其GPU的替代品時。
知識產(chǎn)權(quán)授權(quán)與實際的整合工作相結(jié)合,往往是下一代芯片開發(fā)產(chǎn)生真正影響力的地方。因此,觀察英偉達是將Groq的推理IP整合到其現(xiàn)有的GPU架構(gòu)中,還是開發(fā)一種LPU+GPU混合解決方案,將會非常有趣。
盡管如此,Groq與英偉達之間的非排他性授權(quán)協(xié)議標志著AI基礎(chǔ)設(shè)施進入了一個新的成熟階段,推理正逐漸成為一種商品。這對于AI推理硬件及其伴隨的軟件實力來說,是激動人心的時刻。
作者:Majeed Ahmad,EDN和Planet Analog的主編,報道電子設(shè)計行業(yè)超過二十年。在此期間,他曾擔(dān)任各種編輯職務(wù),包括為EE Times Asia和Electronic Products供稿。他擁有埃因霍溫理工大學(xué)電信工程碩士學(xué)位。
原文:Groq: Nvidia’s $20 Billion Bet on AI Inference - EE Times - https://www.eetimes.com/groq-nvidias-20-billion-bet-on-ai-inference/
新聞來源:訊石光通訊網(wǎng)