ICC訊 GPU最初并非為智能而生。這些芯片是像素處理器,專為快速浮點計算而設(shè)計,旨在渲染視頻游戲和3D圖形的炫目視覺效果。但這條路徑正出現(xiàn)裂痕,投資者和技術(shù)專家都在質(zhì)疑,GPU能否持續(xù)滿足其設(shè)計初衷之外的智能需求。英偉達AI驅(qū)動的增長是充滿風險的,尤其考慮到這已遠超出該公司最初的設(shè)計目的。
這就是為什么即使在近期業(yè)績井噴的情況下,像Michael Burry、Peter Thiel和軟銀這樣的“聰明錢”(smart money)投資者也在悄然退場。在機構(gòu)投資者中,美國銀行最近的一項調(diào)查顯示,45%的受訪者指出AI泡沫是首要風險。并且,20年來首次,多數(shù)受訪者認為公司投資過度,這一激增“源于對AI資本支出熱潮的規(guī)模及融資方式的擔憂”。
GPU的成功與根本局限
盡管GPU取得了巨大成功,我們?nèi)砸训诌_一個危機點。在自動駕駛領(lǐng)域,GPU存在實際局限,無法滿足車載AI系統(tǒng)的散熱和能耗限制,這促使特斯拉等公司開發(fā)自己的定制解決方案以替代GPU。而大語言模型持續(xù)產(chǎn)生“幻覺”,即使有龐大的GPU集群運行這些模型,因為計算雖然加速了,卻沒有產(chǎn)生更可信的結(jié)果。
近70年來,科技經(jīng)濟的流動符合邏輯。硬件構(gòu)建軟件,軟件轉(zhuǎn)變?yōu)槠脚_,平臺承載應用,應用到達用戶手中。資金從物理世界流向數(shù)字世界。隨著數(shù)據(jù)中心增長、AI和GPU的發(fā)展,情況發(fā)生了逆轉(zhuǎn)。價值向下轉(zhuǎn)移到土地、冷卻、電力、物理基礎(chǔ)設(shè)施和熱物理學。技術(shù)棧底層的基礎(chǔ)設(shè)施,比構(gòu)建在其上的各層更有價值。
當這種逆轉(zhuǎn)發(fā)生時,頂層的風險就會暴露。GPU在這種逆轉(zhuǎn)中并非天生有缺陷,但轉(zhuǎn)向GPU部署會將價值轉(zhuǎn)移到昂貴的基礎(chǔ)設(shè)施上。這給投資者和合作伙伴提出了一個問題:英偉達的AI相關(guān)產(chǎn)品能否保持其發(fā)展步伐?英偉達的GPU對其利潤表而言是一個絕無僅有的“幸運意外”,但公司設(shè)計它們的初衷是用于圖形可視化和游戲。
“雙重陷阱”問題即是此類挑戰(zhàn)之一。首先是“精確但不真實”,即傳統(tǒng)AI在數(shù)值上是精確的,但你無法總是信任或可靠地復現(xiàn)結(jié)果。另一個陷阱是“有推理無記憶”,即大語言模型并不理解它們輸出某個答案的“過程”和原因。沒有內(nèi)在邏輯或?qū)ν评砺窂降睦斫?,這意味著AI只是在產(chǎn)生模仿,而非真正的理解。AI推理的這些根本局限不僅僅是理論上的,它們還導致了巨大的能源和算力需求,并暴露了當前基于GPU的AI系統(tǒng)的能力上限。盡管GPU以加速的規(guī)模暴露了雙重陷阱的缺陷,但GPU本身并非原因。
英偉達在更廣闊的AI生態(tài)系統(tǒng)中遭遇挫折,并不意味著GPU將不復存在。它們?nèi)匀皇浅錾募铀倨?,對游戲?chuàng)新以及增強現(xiàn)實和虛擬現(xiàn)實的突破至關(guān)重要。圖形渲染和物理模擬仍將依賴GPU,科學計算和高性能計算也是如此。但GPU并不智能;它被設(shè)計用來進行插值、乘法和累加,以并行的、可預測的工作負載來變換幾何形狀和模擬著色。大語言模型所追求和承諾的智能恰恰相反。它是順序的、有狀態(tài)的、無界的和符號化的。
能耗與物理極限的挑戰(zhàn)
GPU也是電力和能源的消耗大戶,使其長期可持續(xù)性面臨極大挑戰(zhàn)。高盛預測,到2027年,全球數(shù)據(jù)中心的電力需求將增加50%。熱量打破了擴展曲線。據(jù)麥肯錫數(shù)據(jù),基于空氣的冷卻消耗了典型數(shù)據(jù)中心高達40%的能源。再加上每天高達500萬加侖的用水量,這些數(shù)據(jù)中心僅為了冷卻芯片和對抗物理規(guī)律就蒸發(fā)了大量水資源。訓練成本是另一個斷點:單次訓練運行就需要大量調(diào)用GPU,增加了更多成本和用水。
當然,英偉達公布了創(chuàng)紀錄的利潤并超出盈利預期。但隨后的短暫反彈后,其股價仍低于歷史高點,這提醒投資者,近期的成功可能已達到維持AI硬件和軟件擴展步伐的極限。是什么導致了更廣泛的下行情緒?軟件領(lǐng)域的領(lǐng)導者們表示,當前的大語言模型并非完全可靠或可信,因此需要一條新的路徑。
黃仁勛本人在2024年11月的一次采訪中表示:“我們必須達到這樣一個程度:你得到的答案,你大體上是信任的。我認為我們還需要幾年時間才能做到這一點,與此同時,我們必須不斷增加計算量?!?
現(xiàn)實將通過物理或經(jīng)濟約束影響AI和GPU,正如在每個技術(shù)周期中發(fā)生的那樣?;ヂ?lián)網(wǎng)初創(chuàng)公司曾承諾不受限制的增長,但基礎(chǔ)設(shè)施成本和未經(jīng)證實的商業(yè)模式阻礙了它們。智能手機則遇到了電池化學技術(shù)的極限。
“浮點泡沫”與未來轉(zhuǎn)向
我們正在進入GPU和英偉達的“浮點泡沫”(floating-point bubble)現(xiàn)實。人們曾經(jīng)相信,20世紀80年代發(fā)展起來的浮點運算將使模型更大、更具創(chuàng)新性。但現(xiàn)在正出現(xiàn)修正,因為物理學設(shè)定了邊界。存在一個三重天花板,其中能量主要消耗在數(shù)據(jù)移動上,并觸及電力和冷卻的制約。
計算面臨著延遲、帶寬和非確定性瓶頸,而隨著每個新的大語言模型帶來的每瓦特和每美元收益遞減,資本也在收緊。用GPU擴展AI正觸及經(jīng)濟和物理極限,以至于構(gòu)建更大的基于GPU的模型并不能保證改進結(jié)果。
即將到來的修正將轉(zhuǎn)向更小、更具創(chuàng)新性的基礎(chǔ)設(shè)施,讓每一美元的計算帶來更強的推理能力、更高的精度和回報。下一波浪潮將屬于確定性的、可復現(xiàn)的計算,其中每個決策和每焦耳能量都經(jīng)過驗證和審計。下一批AI贏家將看到成果不是由規(guī)模定義,而是由精度定義。
原文:Why Nvidia's AI Empire Faces a Reckoning in 2026 - EE Times - https://www.eetimes.com/why-nvidias-ai-empire-faces-a-reckoning-in-2026/
新聞來源:訊石光通訊網(wǎng)