【高端訪(fǎng)談】專(zhuān)訪(fǎng)無(wú)問(wèn)芯穹CEO:DeepSeek大熱給國產(chǎn)算力帶來(lái)哪些機遇?
DeepSeek火爆之后,算力成為業(yè)界關(guān)注的焦點(diǎn)。雖然成立不滿(mǎn)兩年,無(wú)問(wèn)芯穹已經(jīng)吸引了近10億元融資。近日,記者專(zhuān)訪(fǎng)了無(wú)問(wèn)芯穹CEO夏立雪,聚焦當前市場(chǎng)對于算力的三大關(guān)切點(diǎn)。
新華財經(jīng)上海2月20日電(記者杜康)今年以來(lái),國產(chǎn)人工智能大模型DeepSeek大熱。前不久,《麻省理工科技評論》一篇題為《關(guān)注DeepSeek之外的四家中國人工智能初創(chuàng )公司》的文章引發(fā)關(guān)注,無(wú)問(wèn)芯穹便是文中列舉的四家初創(chuàng )公司之一,專(zhuān)注于異構算力。雖然成立不滿(mǎn)兩年,無(wú)問(wèn)芯穹已經(jīng)吸引了近10億元融資。
DeepSeek火爆之后,行業(yè)探討的一個(gè)焦點(diǎn)是,這將會(huì )如何影響國產(chǎn)算力?可以看到,DeepSeek出圈后,國內的芯片廠(chǎng)商反應迅速,華為昇騰、海光信息、沐曦、天數智能、摩爾線(xiàn)程、壁仞等多家國產(chǎn)AI 芯片等宣布完成適配 DeepSeek 模型。記者近日專(zhuān)訪(fǎng)了無(wú)問(wèn)芯穹CEO夏立雪,聚焦當前市場(chǎng)對于國產(chǎn)算力的三大關(guān)切點(diǎn)。
一問(wèn):DeepSeek的低成本,是否意味著(zhù)對算力需求變低?
從DeepSeek正式發(fā)布的技術(shù)報告來(lái)看,R1的基礎模型V3總訓練成本僅為557萬(wàn)美元。相較之下,GPT-4o這樣的模型訓練成本約為1億美元。這意味著(zhù)DeepSeek的成本只有GPT-4o的1/20。
低成本實(shí)現的背后,是DeepSeek對于算力的高效利用?!拔覀冞M(jìn)一步對DeepSeek-V3的論文做解讀,可以看到它用十多頁(yè)專(zhuān)門(mén)介紹系統架構設計,核心是利用軟硬件協(xié)同設計的思想,不斷提升‘系統開(kāi)銷(xiāo)’(即模型的訓練成本)到模型尺寸、能力的轉化率?!?/span>夏立雪說(shuō)。
既然依靠低算力,也能訓練出“厲害”的大模型,是否意味著(zhù),未來(lái)關(guān)于算力的需求并沒(méi)有預想的那么多?夏立雪給出了否定的答案。
一直以來(lái),大模型行業(yè)存在“Scaling law”,即通過(guò)增加模型規模、數據量和計算能力,可以持續提升大模型性能。這也導致了一種趨勢,即盲目追求更大的模型和更多的算力,常常忽視了計算資源和能源消耗的成本,以及模型在實(shí)際應用中的效率問(wèn)題。
“DeepSeek并沒(méi)有證明Scaling law是錯的。量變引起質(zhì)變,規模擴大依然是DeepSeek獲得智能提升的基礎。DeepSeek模型共發(fā)布了3個(gè)大版本,大概每半年更新一次,參數規模從67B擴大到236B再到如今671B。能讓DeepSeek出圈的一個(gè)重要因素是,它的模型體量提升了10倍,但所使用的算力并沒(méi)有隨著(zhù)模型尺寸等比例成倍增加,可以說(shuō)遠低于預期?!?/span>
事實(shí)上,DeepSeek出來(lái)之后,美國的大廠(chǎng)并沒(méi)有削減其算力開(kāi)支,反而以更大、更激進(jìn)的投入卷“算力”。
2月18日,埃隆·馬斯克發(fā)布其最新一代大模型Gork3,宣稱(chēng)使用了20萬(wàn)塊H100 GPU,據估算這一成本相當于DeepSeek模型的200多倍。
從公開(kāi)數據來(lái)看,2025年美國科技四巨頭資本支出仍將高速增長(cháng)。最新財報電話(huà)會(huì )顯示,微軟計劃2025年資本支出將環(huán)比增加;亞馬遜計劃2025年投入1000億美元資本支出,增速將接近30%,谷歌計劃在2025年投入750億美元資本支出,增速將超過(guò)40%。Meta預計2025年資本支出為600億-650億美元,增速將高達60%-75%。
不過(guò)夏立雪提到,隨著(zhù)DeepSeek的火爆,未來(lái)關(guān)于算力的需求結構會(huì )發(fā)生變化,相較而言,推理算力的需求會(huì )急劇增加?!癉eepSeek的開(kāi)源,夯實(shí)了一個(gè)市場(chǎng)上的重要生態(tài)位,叫做‘好用的中文開(kāi)源模型’,尤其是其在推理能力上的突破,將會(huì )激發(fā)越來(lái)越多的下游應用創(chuàng )造力?!?/p>
二問(wèn):DeepSeek的火爆,為國產(chǎn)芯片帶來(lái)哪些機會(huì )?
“對于國產(chǎn)芯片來(lái)說(shuō),DeepSeek首先是證明了一種方法論的可行性,讓軟硬件聯(lián)合優(yōu)化的技術(shù)路徑再次被印證?!毕牧⒀┱f(shuō)。
“DeepSeek在工程化方面的優(yōu)化,讓我們感受到了一種匠人精神?!毕牧⒀┙忉尫Q(chēng),DeepSeek提出了多個(gè)軟硬件協(xié)同設計方法,并通過(guò)“極致”的系統工程落地來(lái)實(shí)現。
“這些優(yōu)化大致可分為兩類(lèi)。一是深入到底層硬件的硬核優(yōu)化,這需要對底層的硬件有充分理解,并能夠在硬件層面得到足夠開(kāi)放的軟件生態(tài),比如對底層PTX編程,又如極致的內存優(yōu)化;第二是打通從算法到硬件的協(xié)同優(yōu)化,這需要對于從算法到硬件各個(gè)層次都有充分的理解,并具有極致的工程實(shí)現能力?!?/p>
這條路徑的走通,可以說(shuō)為國產(chǎn)芯片注入了一劑“強心針”?!凹热籇eepSeek能夠通過(guò)軟硬件協(xié)同優(yōu)化提升英偉達芯片的效能,那么也可以用同樣的思路提升國產(chǎn)芯片的效能。國產(chǎn)芯片與海外芯片的差距,有望通過(guò)這種方式得到部分彌合。這也證明了我們的預判,用代際相對落后的算力來(lái)訓練先進(jìn)模型是可行路徑?!毕牧⒀┱f(shuō)。
走通軟硬件協(xié)同的路徑,需要關(guān)注模型、系統、芯片三個(gè)關(guān)鍵因素。在海外,這三者已經(jīng)形成閉環(huán)生態(tài)。
“英偉達一直知道,它下一代芯片的優(yōu)化方向是什么,這是CUDA(Compute Unified Device Architecture,軟硬體統一計算架構)為其帶來(lái)的護城河,也是讓英偉達芯片保持領(lǐng)先的原因之一。CUDA的軟件堆棧,可以讓研究人員和軟件開(kāi)發(fā)者更好地在GPU上編程和構建各種各樣的應用,從而牽引下一代芯片的迭代方向?!毕牧⒀┍硎?。
困擾國產(chǎn)芯片的其中一個(gè)問(wèn)題就在于,生態(tài)難形成。夏立雪表示,如今,國產(chǎn)芯片也有機會(huì )迎來(lái)自己的正向循環(huán)。
“DeepSeek的突破激發(fā)了越來(lái)越多的下游應用創(chuàng )造力,不僅將激發(fā)國產(chǎn)芯片的市場(chǎng)需求,也為打造全國產(chǎn)AI產(chǎn)業(yè)閉環(huán),實(shí)現更可控的自主算力發(fā)展創(chuàng )造了有力條件。”
談及國產(chǎn)芯片的未來(lái),夏立雪提出了“三步走”的思路,第一步是基于主流芯片開(kāi)展極致軟硬件協(xié)同優(yōu)化,以有限算力實(shí)現國產(chǎn)模型能力追趕;第二步,是推動(dòng)國產(chǎn)芯片開(kāi)放底層生態(tài),搭建“異構”AI系統解決算力缺口,實(shí)現模型能力趕超;第三步,則是構建國產(chǎn)“同構”系統,實(shí)現“國產(chǎn)模型-國產(chǎn)芯片-國產(chǎn)系統”的全國產(chǎn)AI產(chǎn)業(yè)閉環(huán),實(shí)現更可控的自主算力發(fā)展。
三問(wèn):國產(chǎn)算力的“異構”模式,商業(yè)路徑走通了嗎?
“我們希望讓算力使用起來(lái)像水、電、煤一樣便捷?!毕牧⒀┻@樣描述無(wú)問(wèn)芯穹的愿景。
“中國當前特有的AI基礎設施是多模型和多芯片,存在大量的異構算力,需要把它們變得能用,進(jìn)而變得好用。只有在使用的閉環(huán)中,才能形成硬件與算法之間的正向循環(huán)?!毕牧⒀┱f(shuō)。
記者了解到,無(wú)問(wèn)芯穹希望通過(guò)異構云,擴大國內大模型產(chǎn)業(yè)可用算力的范圍,提升算力利用效率?!?span style="color: #3598db;">未來(lái),我們會(huì )把各種異構的、跨地域的算力整合起來(lái)提供給客戶(hù),將異構算力轉化為標準的算力,服務(wù)于人工智能行業(yè)。”
前不久的2月11日,無(wú)問(wèn)芯穹宣布獲七家國產(chǎn)芯片支持,將打通DeepSeek-R1、V3在壁仞、海光、摩爾線(xiàn)程、沐曦、昇騰、燧原、天數智芯等七個(gè)硬件平臺的多芯片適配優(yōu)化,成為首個(gè)同時(shí)支持 DeepSeek 多芯片適配和推理的平臺。
構建異構算力平臺,需要攻破很多技術(shù)瓶頸。夏立雪坦言,異構情況下的確出過(guò)現相同數量的國產(chǎn)芯片加上英偉達芯片,訓練表現不如單獨英偉達芯片的情況。如今,隨著(zhù)技術(shù)的逐漸成熟和上下游生態(tài)的共同努力,這一商業(yè)模式已見(jiàn)曙光。
“在某些特定場(chǎng)景下,使用國產(chǎn)芯片或異構芯片已被驗證性?xún)r(jià)比能超過(guò)英偉達。隨著(zhù)DeepSeek激發(fā)下游應用創(chuàng )造力,更多中腰部廠(chǎng)商將嘗試這種方式?!毕牧⒀┱f(shuō)。
?
編輯:王媛媛
?
聲明:新華財經(jīng)為新華社承建的國家金融信息平臺。任何情況下,本平臺所發(fā)布的信息均不構成投資建議。如有問(wèn)題,請聯(lián)系客服:400-6123115