猫咪最新永久在线网站,欧美肥妇多毛BBW,大肉大捧一进一出好爽视色大师,国产亚av手机在线观看

歡迎您來(lái)到深圳凌創(chuàng)輝電子有限公司!
0755-83216080

Agentic?AI狂潮:為什么DeepSeek之后,AI芯片更暢銷了?

2025-05-01 13

很多人說(shuō)DeepSeek只是資本市場(chǎng)和民族主義的狂歡。但實(shí)際上就產(chǎn)品化的角度來(lái)看,DeepSeek-R1模型已經(jīng)在包括騰訊微信、百度搜索、知乎直答等普通人能接觸到的應(yīng)用中全面接入——即便DeepSeek的確有著偏高的幻覺(jué)率,經(jīng)常瞎說(shuō)八道,但它對(duì)中文網(wǎng)絡(luò)而言,的確已經(jīng)成為不少人的工作助手。gmMesmc

但與此同時(shí),我們也看到了今年春節(jié)前后DeepSeek爆火之時(shí),資本市場(chǎng)的不理性。最初報(bào)道普遍提及DeepSeek-V3總訓(xùn)練成本不到600萬(wàn)美元,且模型質(zhì)量還超越了同期的Llama 3.1, Claude 3.5;DeepSeek官網(wǎng)面向開(kāi)發(fā)者的API標(biāo)價(jià)(每百萬(wàn)token價(jià)格)僅有OpenAI o1的幾十分之一;甚至有社區(qū)愛(ài)好者嘗試在本地部署滿血版617B參數(shù)規(guī)模的DeepSeek-R1,硬件成本投入不過(guò)4-5萬(wàn)元人民幣。gmMesmc

有關(guān)AI使用成本大幅降低的說(shuō)法登上不少媒體的頭版頭條,提供AI基礎(chǔ)設(shè)施的NVIDIA股價(jià)隨之下跌,就連能源板塊都受到影響。市場(chǎng)對(duì)AI芯片的需求真的會(huì)隨著DeepSeek的推出變得更低,乃至連電力需求也沒(méi)有之前預(yù)測(cè)得那么激進(jìn)了嗎?gmMesmc

前不久在《國(guó)際電子商情》姊妹刊《電子工程專輯》發(fā)布的《DeepSeek的杰文斯悖論:AI芯片市場(chǎng)發(fā)展前瞻》一文中,我們明確提到了AI芯片及基礎(chǔ)設(shè)施短期受到DeepSeek的影響,只是市場(chǎng)的不理性行為。本文則期望從相對(duì)更全面的角度來(lái)解讀AI芯片市場(chǎng)的潛在發(fā)展可能性,及為什么說(shuō)DeepSeek實(shí)際上是在助推AI芯片行業(yè)前行。gmMesmc

明確兩個(gè)基本事實(shí)

過(guò)去大半年,AI領(lǐng)域內(nèi)特別火的一個(gè)詞是Agentic AI——國(guó)內(nèi)有譯作代理式AI,也有譯作智能體AI的。參照NVIDIA對(duì)Agentic AI的定義,這個(gè)詞出現(xiàn)在Generative AI(生成式AI)之后,在Physical AI(具身智能)之前(圖1)。gmMesmc

gmMesmc

圖1:AI發(fā)展的幾個(gè)階段 圖片來(lái)源:英偉達(dá)gmMesmc

拋開(kāi)Agentic AI有利用各類技術(shù)“自動(dòng)適配”做決策的能力,今年NVIDIA的GTC開(kāi)發(fā)者大會(huì)上,黃仁勛說(shuō)Agentic AI的關(guān)鍵特性是在感知和理解上下文以后,“它能邏輯推理(reason),通過(guò)推理來(lái)回答或解決問(wèn)題。”“它能在做出規(guī)劃以后再采取行動(dòng)。”“現(xiàn)在,它還能理解多模態(tài)信息,學(xué)習(xí)網(wǎng)站或不同來(lái)源的文本、圖片、視頻資料,并基于這些信息和知識(shí)來(lái)工作。”gmMesmc

中文網(wǎng)絡(luò)普遍將reason譯作“推理”——但請(qǐng)注意這里的推理和我們?cè)谡凙I訓(xùn)練與推理(reference)式的推理有區(qū)別。Reference指的是將已經(jīng)訓(xùn)練好的AI模型投入到實(shí)際使用中,使用模型的過(guò)程即為reference;而reason則是指,通過(guò)一步步的規(guī)劃和邏輯推理來(lái)解決復(fù)雜問(wèn)題的過(guò)程。gmMesmc

我們可以認(rèn)為,開(kāi)啟了“深度思考”以后的DeepSeek-R1即為典型的Agentic AI。目前新推向市場(chǎng)的對(duì)話式AI基本也都已經(jīng)支持以邏輯推理的形式回答和解決問(wèn)題了。而reason的過(guò)程的確包括了reference。通常我們說(shuō)reason需要對(duì)相關(guān)信息(內(nèi)部和外部的)做結(jié)構(gòu)化,形成邏輯步驟進(jìn)行邏輯推理,已經(jīng)不單是獲取和使用既有信息的簡(jiǎn)單reference。gmMesmc

比如黃仁勛在主題演講中提到的一個(gè)例子,讓AI安排婚宴之上的座次。這個(gè)問(wèn)題需要考慮的因素至少包括了文化傳統(tǒng)、人際關(guān)系、家庭成員親疏、方便拍照的角度等。傳統(tǒng)大語(yǔ)言模型回答該問(wèn)題時(shí),以“one-shot”的方式給出答案少于500個(gè)token。云上的此類大語(yǔ)言模型服務(wù)都能迅速作答。gmMesmc

而邏輯推理模型(reasoning model)需要用到將近9,000個(gè)token才給出答案,正式作答的響應(yīng)時(shí)間相比one-shot式的回答方式也慢了不少。但兩相對(duì)比不難發(fā)現(xiàn),one-shot式的大語(yǔ)言模型更容易給出錯(cuò)誤答案,具備reason邏輯推理能力的大語(yǔ)言模型則能輕易給出優(yōu)解。gmMesmc

觀察DeepSeek-R1正式作答前的思考過(guò)程會(huì)發(fā)現(xiàn),它甚至?xí)?duì)已經(jīng)獲得的答案再做回測(cè)。邏輯推理模型會(huì)對(duì)問(wèn)題做拆解,會(huì)在不同的方法間選擇最佳答案,會(huì)做一致性測(cè)試,甚至?xí)⒌玫降拇鸢?ldquo;放回到方程中,確保其更高的正確性”(圖2)。gmMesmc

gmMesmc

圖2:分步驟推理問(wèn)題的Agentic AI 圖片來(lái)源:國(guó)際電子商情gmMesmc

從高抽象維度了解Agentic AI,對(duì)于我們搞清楚AI芯片市場(chǎng)的潛在發(fā)展有什么價(jià)值呢?因?yàn)榧热徊簧偃苏J(rèn)為DeepSeek這類邏輯推理模型的誕生會(huì)讓AI芯片及基礎(chǔ)設(shè)施需求降低,我們就有必要先理解其基本概念,以及另外兩個(gè)基本事實(shí):(1)Agentic AI是否顛覆了現(xiàn)有AI技術(shù)范式;(2)Agentic AI處在AI歷史發(fā)展長(zhǎng)河里的哪個(gè)階段?gmMesmc

第一個(gè)問(wèn)題很容易回答:雖然Agentic AI變得更智能了,也被包括NVIDIA在內(nèi)的企業(yè)劃歸在生成式AI(Generative AI)之后,但其核心仍然是生成式AI,雖然它相較以前的大語(yǔ)言模型更高級(jí)了。其工作方式一樣未脫離預(yù)訓(xùn)練、后訓(xùn)練(包括fine-tune等流程)、推理(inference)的范式。gmMesmc

幻方量化和梁文鋒團(tuán)隊(duì)的確在DeepSeek模型的訓(xùn)練階段做出了各種工程創(chuàng)新,尤其在技術(shù)禁運(yùn)的前提下,實(shí)現(xiàn)硬件利用效率的最大化,使得其訓(xùn)練成本得到可觀的降低。但不得不承認(rèn)的是,其中的絕大部分方法和技術(shù)是站在了巨人的肩膀上,比如說(shuō)MLA(多層注意力架構(gòu))、MTP(多token預(yù)測(cè))都是既有技術(shù)方案,DeepSeek則是這些技術(shù)實(shí)踐的佼佼者。gmMesmc

所以第一個(gè)問(wèn)題的答案是,包括DeepSeek在內(nèi)的Agentic AI并沒(méi)有顛覆現(xiàn)有AI技術(shù)范式?,F(xiàn)有絕大部分加入了邏輯推理能力的對(duì)話AI服務(wù)也依舊需要持續(xù)對(duì)模型做出精進(jìn),并在和用戶的交互中進(jìn)行推理(reference)。gmMesmc

至于第二個(gè)問(wèn)題,Agentic AI對(duì)于AI而言處在哪個(gè)階段。我們?cè)谶^(guò)去一個(gè)季度采訪了好些市場(chǎng)參與者。幾乎所有市場(chǎng)參與者都認(rèn)為,雖然AI是個(gè)有些年頭的技術(shù),但其發(fā)展階段依舊相對(duì)初級(jí)。比如Imagination Technologies產(chǎn)品管理與市場(chǎng)營(yíng)銷副總裁Dennis Laudick在接受《國(guó)際電子商情》采訪時(shí)就說(shuō):“從人工智能的改進(jìn)規(guī)模和速度來(lái)看,很明顯,我們僅僅處于計(jì)算機(jī)編程方式和計(jì)算機(jī)功能發(fā)生根本性變革的開(kāi)端。”gmMesmc

“展望未來(lái),科技行業(yè)目前需努力的一個(gè)關(guān)鍵任務(wù)是利用現(xiàn)在可獲得的投資,開(kāi)發(fā)相關(guān)解決方案和應(yīng)用,為人工智能提供動(dòng)力,使其走出增長(zhǎng)階段,并充分發(fā)揮其潛力。”Dennis提到,自動(dòng)駕駛、智能機(jī)器人都是對(duì)于AI而言極具吸引力和有待釋放價(jià)值的市場(chǎng)。gmMesmc

通常某市場(chǎng)處在初級(jí)發(fā)展階段時(shí),會(huì)有幾個(gè)明確的市場(chǎng)信號(hào):(1)市場(chǎng)參與者很多,初創(chuàng)企業(yè)扎堆,“百花齊放”;(2)部分市場(chǎng)參與者營(yíng)收和利潤(rùn)呈現(xiàn)出飆升態(tài)勢(shì)。或也可能是技術(shù)未全面落地之前,部分市場(chǎng)參與者處在長(zhǎng)期虧損狀態(tài),投資者則因?yàn)榭春迷撌袌?chǎng),而持續(xù)為其輸血,尋求長(zhǎng)期利益。gmMesmc

AI芯片市場(chǎng)基本具備上述所有特點(diǎn)?!峨娮庸こ虒]嫛?024 Q4的國(guó)產(chǎn)AI芯片研究報(bào)告提到現(xiàn)有AI芯片市場(chǎng)參與者依舊眾多;頭部上市企業(yè)如寒武紀(jì)自上市以來(lái)虧損現(xiàn)狀暫無(wú)改善跡象,營(yíng)收不確定性明確;NVIDIA 2025財(cái)年?duì)I收1,305億美元,同比增長(zhǎng)114%——其中數(shù)據(jù)中心營(yíng)收1,152億美元,增幅達(dá)到了142%——要知道這種看起來(lái)夸張的增速已經(jīng)持續(xù)了好幾年。gmMesmc

Agentic AI帶來(lái)了什么

那么基于上述兩個(gè)問(wèn)題的結(jié)論(1)包括Agentic AI在內(nèi)的AI技術(shù)目前尚處于發(fā)展早期或高速發(fā)展期,(2)AI技術(shù)范式并未發(fā)生根本性轉(zhuǎn)變,基本可以推倒出,AI芯片、基礎(chǔ)設(shè)施都將持續(xù)高速發(fā)展,而不是像年初市場(chǎng)預(yù)期的那樣需求走低。那么市場(chǎng)潛力究竟還有多大,或者說(shuō)Agentic AI究竟能帶來(lái)什么?gmMesmc

NVIDIA自己公布的數(shù)據(jù)是,面向美國(guó)4家頂級(jí)CSP(云服務(wù)供應(yīng)商,包括AWS, Azure, GCP和OCI)的上一代Hopper顯卡出貨量,2024年達(dá)到巔峰,約為130萬(wàn)片GPU。而去年GTC之上發(fā)布的Blackwell顯卡,到今年3月為止,則已經(jīng)面向這幾家CSP出貨了大約360萬(wàn)片GPU。這份數(shù)據(jù)一方面自然能看出,NVIDIA實(shí)現(xiàn)業(yè)績(jī)高速增長(zhǎng)的部分依據(jù);但與此同時(shí)也能表現(xiàn)AI技術(shù)處在發(fā)展的初級(jí)或高速發(fā)展階段。gmMesmc

所以研究機(jī)構(gòu)Dell'Oro認(rèn)為,全球數(shù)據(jù)中心的CapEx(資本支出)會(huì)在2028年超過(guò)1萬(wàn)億美金;部分研究機(jī)構(gòu)也將2030年半導(dǎo)體市場(chǎng)價(jià)值將破萬(wàn)億美金的時(shí)間預(yù)期做了調(diào)整(比如IBS就將行業(yè)破萬(wàn)億的時(shí)間提前到了2028年),皆因AI技術(shù)的發(fā)展超出了許多人的預(yù)期。gmMesmc

這里的確有個(gè)相當(dāng)不符合直覺(jué)的事實(shí):如果說(shuō)DeepSeek提高了AI技術(shù)的效率,相同算力達(dá)成的AI智能程度更高了,那么為什么說(shuō)AI芯片及基礎(chǔ)設(shè)施價(jià)值還將持續(xù)走高?我們認(rèn)為,這個(gè)問(wèn)題大概可以從兩個(gè)角度來(lái)回答。(1)Agentic AI對(duì)AI算力的需求變化;(2)市場(chǎng)發(fā)展的杰文斯悖論。gmMesmc

先談第一個(gè)角度:Agentic AI對(duì)AI算力的需求變化問(wèn)題。探討算力需求變化,無(wú)非分訓(xùn)練、推理(reference)兩部分。gmMesmc

從訓(xùn)練的角度來(lái)說(shuō),現(xiàn)有分析資料已經(jīng)有不少去談DeepSeek公開(kāi)所謂不到600萬(wàn)美元的訓(xùn)練成本實(shí)則僅涵蓋了總體成本的一部分——這600萬(wàn)美元只包括了預(yù)訓(xùn)練的GPU固定成本開(kāi)銷,并沒(méi)有算上研發(fā)、人才、硬件等的總成本;也沒(méi)有算上企業(yè)要真正應(yīng)用DeepSeek模型時(shí)的后訓(xùn)練成本——就像騰訊面向微信用戶開(kāi)放DeepSeek模型使用,并不是將模型拿來(lái),架上自家的數(shù)據(jù)中心就能用的。要知道幻方量化很早就手握“萬(wàn)卡”資源,當(dāng)年僅有百度、騰訊、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠才享有“萬(wàn)卡”入場(chǎng)券。gmMesmc

訓(xùn)練部分的成本問(wèn)題,本文不再做詳述——可以肯定的是,單位算力投入達(dá)成的模型質(zhì)量,或者訓(xùn)練的整體效率水平的確是提高了的,但不能因此認(rèn)為AI時(shí)代的總訓(xùn)練成本有顯著下降,這一點(diǎn)將在后文的杰文斯悖論部分做詳述。gmMesmc

而在推理(reference)部分,很多人將DeepSeek官方標(biāo)定的API百萬(wàn)token輸入價(jià)格(緩存命中時(shí),每百萬(wàn)token,DeepSeek-V3為0.5元,DeepSeek-R1為1元)作為其推理成本低的依據(jù)。但實(shí)際上我們知道幻方量化并沒(méi)有打算藉由DeepSeek的商業(yè)運(yùn)營(yíng)來(lái)實(shí)現(xiàn)大規(guī)模盈利,DeepSeek官網(wǎng)長(zhǎng)期處在“服務(wù)器繁忙”狀態(tài),也未有推理基礎(chǔ)設(shè)施的擴(kuò)大動(dòng)作。這個(gè)標(biāo)價(jià)并不能作為與其他模型推理成本對(duì)比的直接依據(jù)。gmMesmc

本文的第一部分已經(jīng)闡明了Agentic AI并未改變AI技術(shù)范式,與此同時(shí)在婚宴座次安排的例子中,推理模型以將近9,000個(gè)token,得到了最優(yōu)解。9,000個(gè)token的生成,相較于傳統(tǒng)大語(yǔ)言模型one-shot式僅500個(gè)token的輸出,在token生成速度相同的情況下,算力要求高了10+倍。gmMesmc

換句話說(shuō),AI計(jì)算的推理(reference)流程相比以前多出了10+倍的算力需求??赡芎芏嘧x者對(duì)于大語(yǔ)言模型的算力需求沒(méi)有量級(jí)概念。對(duì)于邏輯推理流程來(lái)說(shuō),模型接到請(qǐng)求以后首先進(jìn)行prefill(預(yù)填充)階段——可理解為思考過(guò)程,這個(gè)階段對(duì)算力要求很大;隨后在正式輸出階段,即decode(解碼)階段則對(duì)帶寬要求很高——此過(guò)程需要訪問(wèn)內(nèi)存中的海量數(shù)據(jù),迭代進(jìn)行快速和持續(xù)的數(shù)據(jù)搬運(yùn),每秒數(shù)據(jù)量可以達(dá)到數(shù)百TB/s。gmMesmc

而每個(gè)token的生成都需要反復(fù)進(jìn)行decode操作,每次都意味著萬(wàn)億規(guī)模參數(shù)、海量數(shù)據(jù)訪問(wèn)。也就是說(shuō)將近9,000個(gè)token輸出,每一個(gè)都要經(jīng)歷這種規(guī)模的操作。很顯然,Agentic AI的推理(reference)算力需求相比過(guò)去是顯著增加的(注意:這里不能說(shuō)成本顯著增加)。gmMesmc

在此基礎(chǔ)上還需要考慮一個(gè)因素:由于邏輯推理模型工作時(shí),在算力一定的情況下,響應(yīng)用戶請(qǐng)求的速度變慢了,則企業(yè)基于用戶體驗(yàn)、留住用戶的角度,還要考慮提升響應(yīng)速度。如果響應(yīng)速度能提升10倍,則在token輸出相比過(guò)去要多出10倍的情況下,達(dá)成了用戶體驗(yàn)的平衡。gmMesmc

gmMesmc

圖3:算力一定時(shí),資源分配在AI不同階段的變化 圖片來(lái)源:國(guó)際電子商情gmMesmc

所以總的來(lái)說(shuō),Agentic AI在顯著提升復(fù)雜任務(wù)推理能力的同時(shí),大幅提升了單次推理的算力需求。市場(chǎng)此前認(rèn)定DeepSeek大幅降低了AI訓(xùn)練成本,即便這一命題成立,卻也忽略了其推理資源在增加的事實(shí)(雖然我們不能簡(jiǎn)單地說(shuō),成本在增加)。換句話說(shuō)Agentic AI時(shí)代,整體資源分配方式是從原本高算力需求的預(yù)訓(xùn)練階段,逐漸向推理階段傾斜(圖3)。gmMesmc

更何況,從社會(huì)對(duì)AI的總投入來(lái)看,即便是訓(xùn)練階段,AI的價(jià)值也真的沒(méi)有降低。gmMesmc

5年內(nèi),AI世界都發(fā)生了什么?

有個(gè)頗為有趣的事實(shí),可能是立足生成式AI或Agentic AI帶來(lái)生活與工作便利當(dāng)下的人們已經(jīng)遺忘的:2020年的人類大概無(wú)論如何也不會(huì)想到,2025年的人會(huì)每天和AI說(shuō)話,還借助AI來(lái)討論工作。gmMesmc

現(xiàn)在Youtube上熱門的AI課程,課后作業(yè)會(huì)要求學(xué)生訓(xùn)練7B參數(shù)的模型(實(shí)則為fine-tune)?;仡?019年GPT-2剛發(fā)布之時(shí),1.5B參數(shù)量已經(jīng)讓行業(yè)與資本市場(chǎng)咋舌了。也就是說(shuō),2025年今天的任何一名AI專業(yè)學(xué)生,帶著已經(jīng)不算強(qiáng)的Llama2-7B模型回到2020年前后,就足以讓彼時(shí)的OpenAI感到毀天滅地了??梢?jiàn)AI技術(shù)發(fā)展之快是完全顛覆了當(dāng)代人的認(rèn)知的。gmMesmc

另一個(gè)相關(guān)的重要結(jié)論在《DeepSeek的杰文斯悖論:AI芯片市場(chǎng)發(fā)展前瞻》中:在模型參數(shù)量級(jí)不變的情況下,每8個(gè)月模型能力就提升1倍。去年面壁智能就在發(fā)布會(huì)上說(shuō),如今2B參數(shù)量的模型,在實(shí)際表現(xiàn)上就能比肩幾年前170B參數(shù)量的模型。還有一些研究機(jī)構(gòu)則提出,AI模型要達(dá)成相同能力所需算力,每年降低4-10倍。gmMesmc

則對(duì)應(yīng)的,達(dá)成相同推理(reference)效果的成本就在近兩年大幅下降了。2022年1月GPT3的每百萬(wàn)token推理成本(基于MMLU大型多任務(wù)語(yǔ)言理解基準(zhǔn))還在大幾十美元的高位,GPT3.5 Turbo就將該值拉到了2、3美元的程度,Llama2-7B實(shí)現(xiàn)了百萬(wàn)token推理成本1美元,到近代的Llama 3.2-3B讓這個(gè)數(shù)字低到不足0.1美元。gmMesmc

短短3年時(shí)間,實(shí)現(xiàn)GPT3相似質(zhì)量的AI模型推理價(jià)格下降了1,200倍。(如圖4;注意,這里的成本下降是指單位token的推理成本,而非單次推理的成本也下降到這一量級(jí)水平,尤其考慮Agentic AI單次推理的token數(shù)量增長(zhǎng)了10+倍)gmMesmc

gmMesmc

圖4:2022年至今大語(yǔ)言模型的成本下降趨勢(shì) 圖片來(lái)源:國(guó)際電子商情gmMesmc

可見(jiàn)在AI芯片堆算力“大力出奇跡”的同時(shí),整個(gè)AI技術(shù)棧的上層也在努力提升AI效率,令A(yù)I使用成本的降速遠(yuǎn)快于當(dāng)年半導(dǎo)體領(lǐng)域的摩爾定律。或許很多人將AI技術(shù)稱作人類歷史的第四次科技革命是有道理的。gmMesmc

“這一階段,工程師致力于尋找以更低的成本達(dá)成相同效果的路徑,因此人工智能的發(fā)展階段和機(jī)械化飛行的演進(jìn)并無(wú)二致。”Dennis說(shuō),“像DeepSeek這樣的突破性變化是必然會(huì)出現(xiàn)的。”畢竟要達(dá)成“人工智能無(wú)處不在、人盡可用”的目標(biāo),“就需要以更低的成本和更少的計(jì)算資源來(lái)實(shí)現(xiàn)。”gmMesmc

所以我們才說(shuō)DeepSeek達(dá)成現(xiàn)如今的熱度和成就,是站在了巨人的肩膀上。業(yè)內(nèi)同人過(guò)去幾年就有著相同的目標(biāo)、做著相同的事情。這也是Agentic AI能夠進(jìn)入人們?nèi)粘I畹南葲Q條件。因?yàn)槿绻评沓杀緵](méi)有降到這個(gè)程度,以3年前GPT-3的推理成本,Agentic AI恐怕也只是有錢人的玩具。gmMesmc

這些是人類通往AGI(通用人工智能)的必由之路,則市場(chǎng)更不應(yīng)當(dāng)詫異這些年來(lái)企業(yè)、數(shù)據(jù)中心大量購(gòu)入AI芯片的價(jià)值??赡墁F(xiàn)下的核心問(wèn)題是,AI效率在提高、算力也在提升,那么究竟人類需要多少算力才能達(dá)到真正意義上的AGI?gmMesmc

實(shí)際上研究機(jī)構(gòu)每年所做的市場(chǎng)預(yù)測(cè)就是要回答這個(gè)問(wèn)題?!禗eepSeek的杰文斯悖論:AI芯片市場(chǎng)發(fā)展前瞻》一文也已經(jīng)援引了麥肯錫對(duì)未來(lái)5年的判斷。但我們認(rèn)為,這仍然是個(gè)難以計(jì)算的復(fù)雜問(wèn)題。“即便人工智能模型的效率在不斷提高,對(duì)人工智能的需求的增長(zhǎng)速度仍遠(yuǎn)遠(yuǎn)超過(guò)硬件的供應(yīng)速度。”這是包括Imagination在內(nèi)的幾乎所有市場(chǎng)參與者的共識(shí)。gmMesmc

此處再給另外一個(gè)維度的參考,今年GTC上NVIDIA預(yù)告了2年后要上市的Rubin Ultra NVL576系統(tǒng)——該機(jī)架將由576片Rubin Ultra die構(gòu)成,單片Rubin Ultra片內(nèi)存儲(chǔ)1TB HBM4e。整個(gè)系統(tǒng)性能提升14倍,存儲(chǔ)資源漲8倍,系統(tǒng)內(nèi)和系統(tǒng)外的互聯(lián)帶寬分別提升12倍和8倍(相比于GB300 NVL72)。gmMesmc

這顯然是突破了半導(dǎo)體“摩爾定律”的數(shù)字。數(shù)十倍性能提升在電子系統(tǒng)一年迭代時(shí)間里發(fā)生,且在NVIDIA看來(lái)還未必滿足AI算力需求:可見(jiàn)在現(xiàn)有市場(chǎng)參與者看來(lái),DeepSeek會(huì)降低AI基建需求的早期誤判是可笑的(圖5)。gmMesmc

gmMesmc

圖5:AI數(shù)據(jù)中心將是人類社會(huì)的中堅(jiān)力量 圖片來(lái)源:國(guó)際電子商情gmMesmc

未來(lái)的AI算力需求需求

最后還是回到經(jīng)典的杰文斯悖論。Dennis評(píng)價(jià)DeepSeek的創(chuàng)新成果“實(shí)際上是為AI硬件打開(kāi)了更大的市場(chǎng)”,“為世界創(chuàng)造了更多的AI技術(shù)應(yīng)用空間”,“降低了AI計(jì)算需求門檻,為行業(yè)里的其他傳統(tǒng)企業(yè)和新創(chuàng)公司提供了全新的競(jìng)爭(zhēng)手段”。gmMesmc

就像第一次科技革命之時(shí),蒸汽機(jī)的效率提升致單位動(dòng)力耗煤下降,但社會(huì)的煤炭總消耗量卻因?yàn)檎羝麢C(jī)應(yīng)用場(chǎng)景擴(kuò)展而激增。類比AI市場(chǎng),雖說(shuō)達(dá)成相同能力的AI模型訓(xùn)練和推理成本在下降,但總投入?yún)s將發(fā)生大幅增加——因?yàn)樾枨笠搽S之增加了。gmMesmc

所以我們可以說(shuō)(1)AI成本下降會(huì)進(jìn)一步帶動(dòng)AI應(yīng)用的普及,更多行業(yè)和場(chǎng)景都會(huì)開(kāi)始布局AI應(yīng)用;(2)效率的提升也會(huì)促成新應(yīng)用場(chǎng)景的出現(xiàn),應(yīng)用層面的創(chuàng)新甚至?xí)乾F(xiàn)在的人類始料未及的;gmMesmc

(3)帶動(dòng)AI技術(shù)競(jìng)爭(zhēng)和效率持續(xù)突破,也就是AI技術(shù)棧的持續(xù)效率優(yōu)化會(huì)促進(jìn)競(jìng)爭(zhēng),進(jìn)一步帶動(dòng)市場(chǎng)整體發(fā)展。雖然本文主要是在談AI模型及算法的效率提升,但近些年AI芯片的效率提升也在持續(xù),不僅是NVIDIA的GPU、系統(tǒng)及諸如Dynamo這樣的中間件。Dennis在采訪中也說(shuō),最近發(fā)布的Imagination DXTP GPU IP,能效相比上代提升20%。這在我們看來(lái)會(huì)成為接下來(lái)幾年AI技術(shù)進(jìn)步的常態(tài)。gmMesmc

遙想AlexNet剛剛促成這一波AI熱潮之時(shí),就有人預(yù)言了“強(qiáng)AI”持續(xù)發(fā)展的時(shí)代,每5年的技術(shù)迭代,就可能讓人意想不到,再也回不去從前。今年的IIC Shanghai活動(dòng)上,還有嘉賓認(rèn)為,AI對(duì)人類生活習(xí)慣的潛在影響將超過(guò)智能手機(jī)?;蛟S2、3年以后的人類回望2025年的我們,就已經(jīng)不理解為何當(dāng)時(shí)的人類技術(shù)如此落后了。gmMesmc

3003677450

微信二維碼

掃碼微信咨詢

0755-83216080