<strike id="d8id6"><menu id="d8id6"><big id="d8id6"></big></menu></strike>

<label id="d8id6"></label><label id="d8id6"></label> <label id="d8id6"></label>

<span id="d8id6"><blockquote id="d8id6"></blockquote></span>

首頁(yè) 資訊研報數據行情工具直播金融超市投教指數產(chǎn)品與服務(wù)

主題

熱點(diǎn)

首頁(yè)

股票

債券

外匯

基金

期貨

指數

財經(jīng)日歷

宏觀(guān)數據

研報金榜

合規評測

絲路數據庫

新華財經(jīng)

點(diǎn)金學(xué)堂
ESG
投教基地
路演中心
外匯信息服務(wù)

新華絲路

絲路資訊/智訊/案例/全球數據/知識產(chǎn)權
大講堂
多語(yǔ)言

新華信用

企業(yè)信用
信用發(fā)布
信用領(lǐng)跑
城市信用

新華指數

指數發(fā)布
指數授權
報告編制
智庫咨詢(xún)
定制化服務(wù)
空間系統

首頁(yè) > 要聞 > 正文

【高端訪(fǎng)談】專(zhuān)訪(fǎng)無(wú)問(wèn)芯穹CEO：DeepSeek大熱給國產(chǎn)算力帶來(lái)哪些機遇？

新華財經(jīng)|2025年02月20日

閱讀量：

DeepSeek火爆之后，算力成為業(yè)界關(guān)注的焦點(diǎn)。雖然成立不滿(mǎn)兩年，無(wú)問(wèn)芯穹已經(jīng)吸引了近10億元融資。近日，記者專(zhuān)訪(fǎng)了無(wú)問(wèn)芯穹CEO夏立雪，聚焦當前市場(chǎng)對于算力的三大關(guān)切點(diǎn)。

新華財經(jīng)上海2月20日電（記者杜康）今年以來(lái)，國產(chǎn)人工智能大模型DeepSeek大熱。前不久，《麻省理工科技評論》一篇題為《關(guān)注DeepSeek之外的四家中國人工智能初創(chuàng )公司》的文章引發(fā)關(guān)注，無(wú)問(wèn)芯穹便是文中列舉的四家初創(chuàng )公司之一，專(zhuān)注于異構算力。雖然成立不滿(mǎn)兩年，無(wú)問(wèn)芯穹已經(jīng)吸引了近10億元融資。

DeepSeek火爆之后，行業(yè)探討的一個(gè)焦點(diǎn)是，這將會(huì )如何影響國產(chǎn)算力？可以看到，DeepSeek出圈后，國內的芯片廠(chǎng)商反應迅速，華為昇騰、海光信息、沐曦、天數智能、摩爾線(xiàn)程、壁仞等多家國產(chǎn)AI 芯片等宣布完成適配 DeepSeek 模型。記者近日專(zhuān)訪(fǎng)了無(wú)問(wèn)芯穹CEO夏立雪，聚焦當前市場(chǎng)對于國產(chǎn)算力的三大關(guān)切點(diǎn)。

一問(wèn)：DeepSeek的低成本，是否意味著(zhù)對算力需求變低？

從DeepSeek正式發(fā)布的技術(shù)報告來(lái)看，R1的基礎模型V3總訓練成本僅為557萬(wàn)美元。相較之下，GPT-4o這樣的模型訓練成本約為1億美元。這意味著(zhù)DeepSeek的成本只有GPT-4o的1/20。

低成本實(shí)現的背后，是DeepSeek對于算力的高效利用?！拔覀冞M(jìn)一步對DeepSeek-V3的論文做解讀，可以看到它用十多頁(yè)專(zhuān)門(mén)介紹系統架構設計，核心是利用軟硬件協(xié)同設計的思想，不斷提升‘系統開(kāi)銷(xiāo)’（即模型的訓練成本）到模型尺寸、能力的轉化率?！?/span>夏立雪說(shuō)。

既然依靠低算力，也能訓練出“厲害”的大模型，是否意味著(zhù)，未來(lái)關(guān)于算力的需求并沒(méi)有預想的那么多？夏立雪給出了否定的答案。

一直以來(lái)，大模型行業(yè)存在“Scaling law”，即通過(guò)增加模型規模、數據量和計算能力，可以持續提升大模型性能。這也導致了一種趨勢，即盲目追求更大的模型和更多的算力，常常忽視了計算資源和能源消耗的成本，以及模型在實(shí)際應用中的效率問(wèn)題。

“DeepSeek并沒(méi)有證明Scaling law是錯的。量變引起質(zhì)變，規模擴大依然是DeepSeek獲得智能提升的基礎。DeepSeek模型共發(fā)布了3個(gè)大版本，大概每半年更新一次，參數規模從67B擴大到236B再到如今671B。能讓DeepSeek出圈的一個(gè)重要因素是，它的模型體量提升了10倍，但所使用的算力并沒(méi)有隨著(zhù)模型尺寸等比例成倍增加，可以說(shuō)遠低于預期?！?/span>

事實(shí)上，DeepSeek出來(lái)之后，美國的大廠(chǎng)并沒(méi)有削減其算力開(kāi)支，反而以更大、更激進(jìn)的投入卷“算力”。

2月18日，埃隆·馬斯克發(fā)布其最新一代大模型Gork3，宣稱(chēng)使用了20萬(wàn)塊H100 GPU，據估算這一成本相當于DeepSeek模型的200多倍。

從公開(kāi)數據來(lái)看，2025年美國科技四巨頭資本支出仍將高速增長(cháng)。最新財報電話(huà)會(huì )顯示，微軟計劃2025年資本支出將環(huán)比增加；亞馬遜計劃2025年投入1000億美元資本支出，增速將接近30%，谷歌計劃在2025年投入750億美元資本支出，增速將超過(guò)40%。Meta預計2025年資本支出為600億-650億美元，增速將高達60%-75%。

不過(guò)夏立雪提到，隨著(zhù)DeepSeek的火爆，未來(lái)關(guān)于算力的需求結構會(huì )發(fā)生變化，相較而言，推理算力的需求會(huì )急劇增加?！癉eepSeek的開(kāi)源，夯實(shí)了一個(gè)市場(chǎng)上的重要生態(tài)位，叫做‘好用的中文開(kāi)源模型’，尤其是其在推理能力上的突破，將會(huì )激發(fā)越來(lái)越多的下游應用創(chuàng )造力?！?/p>

二問(wèn)：DeepSeek的火爆，為國產(chǎn)芯片帶來(lái)哪些機會(huì )？

“對于國產(chǎn)芯片來(lái)說(shuō)，DeepSeek首先是證明了一種方法論的可行性，讓軟硬件聯(lián)合優(yōu)化的技術(shù)路徑再次被印證?！毕牧⒀┱f(shuō)。

“DeepSeek在工程化方面的優(yōu)化，讓我們感受到了一種匠人精神?！毕牧⒀┙忉尫Q(chēng)，DeepSeek提出了多個(gè)軟硬件協(xié)同設計方法，并通過(guò)“極致”的系統工程落地來(lái)實(shí)現。

“這些優(yōu)化大致可分為兩類(lèi)。一是深入到底層硬件的硬核優(yōu)化，這需要對底層的硬件有充分理解，并能夠在硬件層面得到足夠開(kāi)放的軟件生態(tài)，比如對底層PTX編程，又如極致的內存優(yōu)化；第二是打通從算法到硬件的協(xié)同優(yōu)化，這需要對于從算法到硬件各個(gè)層次都有充分的理解，并具有極致的工程實(shí)現能力?！?/p>

這條路徑的走通，可以說(shuō)為國產(chǎn)芯片注入了一劑“強心針”?！凹热籇eepSeek能夠通過(guò)軟硬件協(xié)同優(yōu)化提升英偉達芯片的效能，那么也可以用同樣的思路提升國產(chǎn)芯片的效能。國產(chǎn)芯片與海外芯片的差距，有望通過(guò)這種方式得到部分彌合。這也證明了我們的預判，用代際相對落后的算力來(lái)訓練先進(jìn)模型是可行路徑?！毕牧⒀┱f(shuō)。

走通軟硬件協(xié)同的路徑，需要關(guān)注模型、系統、芯片三個(gè)關(guān)鍵因素。在海外，這三者已經(jīng)形成閉環(huán)生態(tài)。

“英偉達一直知道，它下一代芯片的優(yōu)化方向是什么，這是CUDA(Compute Unified Device Architecture，軟硬體統一計算架構）為其帶來(lái)的護城河，也是讓英偉達芯片保持領(lǐng)先的原因之一。CUDA的軟件堆棧，可以讓研究人員和軟件開(kāi)發(fā)者更好地在GPU上編程和構建各種各樣的應用，從而牽引下一代芯片的迭代方向?！毕牧⒀┍硎?。

困擾國產(chǎn)芯片的其中一個(gè)問(wèn)題就在于，生態(tài)難形成。夏立雪表示，如今，國產(chǎn)芯片也有機會(huì )迎來(lái)自己的正向循環(huán)。

“DeepSeek的突破激發(fā)了越來(lái)越多的下游應用創(chuàng )造力，不僅將激發(fā)國產(chǎn)芯片的市場(chǎng)需求，也為打造全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)，實(shí)現更可控的自主算力發(fā)展創(chuàng )造了有力條件。”

談及國產(chǎn)芯片的未來(lái)，夏立雪提出了“三步走”的思路，第一步是基于主流芯片開(kāi)展極致軟硬件協(xié)同優(yōu)化，以有限算力實(shí)現國產(chǎn)模型能力追趕；第二步，是推動(dòng)國產(chǎn)芯片開(kāi)放底層生態(tài)，搭建“異構”AI系統解決算力缺口，實(shí)現模型能力趕超；第三步，則是構建國產(chǎn)“同構”系統，實(shí)現“國產(chǎn)模型-國產(chǎn)芯片-國產(chǎn)系統”的全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)，實(shí)現更可控的自主算力發(fā)展。

三問(wèn)：國產(chǎn)算力的“異構”模式，商業(yè)路徑走通了嗎？

“我們希望讓算力使用起來(lái)像水、電、煤一樣便捷?！毕牧⒀┻@樣描述無(wú)問(wèn)芯穹的愿景。

“中國當前特有的AI基礎設施是多模型和多芯片，存在大量的異構算力，需要把它們變得能用，進(jìn)而變得好用。只有在使用的閉環(huán)中，才能形成硬件與算法之間的正向循環(huán)?！毕牧⒀┱f(shuō)。

記者了解到，無(wú)問(wèn)芯穹希望通過(guò)異構云，擴大國內大模型產(chǎn)業(yè)可用算力的范圍，提升算力利用效率?！?span style="color: #3598db;">未來(lái)，我們會(huì )把各種異構的、跨地域的算力整合起來(lái)提供給客戶(hù)，將異構算力轉化為標準的算力，服務(wù)于人工智能行業(yè)。”

前不久的2月11日，無(wú)問(wèn)芯穹宣布獲七家國產(chǎn)芯片支持，將打通DeepSeek-R1、V3在壁仞、海光、摩爾線(xiàn)程、沐曦、昇騰、燧原、天數智芯等七個(gè)硬件平臺的多芯片適配優(yōu)化，成為首個(gè)同時(shí)支持 DeepSeek 多芯片適配和推理的平臺。

構建異構算力平臺，需要攻破很多技術(shù)瓶頸。夏立雪坦言，異構情況下的確出過(guò)現相同數量的國產(chǎn)芯片加上英偉達芯片，訓練表現不如單獨英偉達芯片的情況。如今，隨著(zhù)技術(shù)的逐漸成熟和上下游生態(tài)的共同努力，這一商業(yè)模式已見(jiàn)曙光。

“在某些特定場(chǎng)景下，使用國產(chǎn)芯片或異構芯片已被驗證性?xún)r(jià)比能超過(guò)英偉達。隨著(zhù)DeepSeek激發(fā)下游應用創(chuàng )造力，更多中腰部廠(chǎng)商將嘗試這種方式?！毕牧⒀┱f(shuō)。

?

編輯：王媛媛

?

聲明：新華財經(jīng)為新華社承建的國家金融信息平臺。任何情況下，本平臺所發(fā)布的信息均不構成投資建議。如有問(wèn)題，請聯(lián)系客服：400-6123115

新華財經(jīng)聲明：本文內容僅供參考，不構成投資建議。投資者據此操作，風(fēng)險自擔。

傳播矩陣

最新要聞更多

熱點(diǎn)專(zhuān)題更多

中經(jīng)社官網(wǎng) 公司介紹產(chǎn)品服務(wù) 聯(lián)系我們廣告招商版權聲明合作伙伴

客服熱線(xiàn)：400-6123115

客服郵箱：xinhuacaijing@xinhua.org

京ICP備17000448號互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號10120230015 廣播電視節目制作經(jīng)營(yíng)許可證:(京)字第03616號

中國金融信息網(wǎng) 版權所有 Copyright ? 2010 - 2024 cnfin.com All Rights Reserved. 未經(jīng)授權不得轉載

支付成功！

查看訂單關(guān)閉

支付未成功

查看訂單關(guān)閉

国产精品被窝福利一区|日本熟妇浓毛hdsex|xxxxx爽日本护士|国产午夜福利精品久久2021|亚洲成无码人在线播放

<strike id="d8id6"><menu id="d8id6"><big id="d8id6"></big></menu></strike>

<label id="d8id6"></label><label id="d8id6"></label> <label id="d8id6"></label>

<span id="d8id6"><blockquote id="d8id6"></blockquote></span>