9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

北斗專訪|無問芯穹夏立雪:如今更關注“用對芯片”而非“用貴芯片”

澎湃新聞高級記者 李佳蔚
2025-05-28 06:56
來源:澎湃新聞
? 浦江頭條 >
字號

【編者按】

“星漢燦爛,若出其里。”人工智能邁入閃耀時刻。

4月29日,習近平總書記來到位于徐匯區(qū)的上?!澳K倏臻g”大模型創(chuàng)新生態(tài)社區(qū)調(diào)研。他指出,人工智能技術加速迭代,正迎來爆發(fā)式發(fā)展,上海要總結(jié)好以大模型產(chǎn)業(yè)生態(tài)體系孵化人工智能產(chǎn)業(yè)等成功經(jīng)驗,加大探索力度,力爭在人工智能發(fā)展和治理各方面走在前列,產(chǎn)生示范效應。

如今,徐匯區(qū)已形成“北斗列陣”+“群星閃耀”的AI生態(tài)布局。其中,“北斗七星”由稀宇科技、商湯科技、階躍星辰、無問芯穹、星紀魅族、特贊科技和斑馬智行7家標桿企業(yè)構成。

這些企業(yè)何以成為“北斗”?它們在人工智能領域有哪些探索和前瞻性的思考?澎湃新聞推出“北斗專訪”系列報道,通過深度對話,解碼標桿企業(yè)的AI星辰版圖。

祝碧晨 海報設計

作為企業(yè)掌舵人,清華大學電子工程系畢業(yè)夏立雪身上帶有理工科學生的氣質(zhì)。如今他的身份是無問芯穹CEO,常穿公司文化衫或西裝出席公開場合,每次采訪均準時現(xiàn)身。

面對澎湃新聞記者的提問,他總會迅速作答,有問必答、條理清晰,即使談及激烈而殘酷的競爭,也保持平和而克制的語調(diào)。

來到上海發(fā)展,這個出生于1991年的青年企業(yè)家開始喜愛這座城市?!吧虾4_實讓我有很大的一個感觸,它和年輕人是很匹配的。我們公司平均年齡32歲,年輕人喜歡上海,可能因為它的文化基因更加開放和活潑?!?/p>

無問芯穹至今成立剛滿兩年,融資近10億元。接下來要不要上市,夏立雪似乎并不心急。他說:“我相信只要堅持做好兩件事,既有技術的持續(xù)領先,又有商業(yè)化的成功,上市只是一個水到渠成的事情?!?/p>

無問芯穹,位于上海徐匯濱江模速空間一樓。受訪者 供圖

擺在眼前的,是AI競爭來到“深水區(qū)”。2025年,大模型在算力上的比拼正發(fā)生深刻轉(zhuǎn)變:從原來的“比誰有更多GPU”,演變成了“比誰能更聰明、更經(jīng)濟地用好手中算力”。

“我們現(xiàn)在需要考慮的是,在算力資源有限的情況下,怎么去解決模型持續(xù)增長的問題?”在夏立雪看來,AI的任務越來越多樣,芯片技術越來越細分,算力資源越來越緊張——于是,“用最適合的芯片做最適合的任務”就成了大趨勢。比如,適合訓練的芯片專注訓練,適合推理的芯片完成推理,適合端側(cè)的芯片負責部署。更重要的是,要發(fā)揮異構算力資源的整體效能。

無論對中國還是全球,整合多元異構算力已不再是權宜之計,而是技術演進、成本壓力和應用多樣化之下的一個必然方向。

2025年5月,上海模速空間,無問芯穹公司門口。澎湃新聞記者 李佳蔚 圖

中國算力資源的一大突出特點是多元異構。市場上主流CPU生態(tài)有5種以上,GPU生態(tài)則多達10種以上,不同的算力芯片、服務器形態(tài)、存儲形態(tài),以及網(wǎng)絡形態(tài)組合配置在一起,可以形成成百上千的組合。

“沒有用不完的英偉達GPU,也不是必須用英偉達的GPU?!毕牧⒀┱f,AI企業(yè)如今更關注“用對芯片”,而非“用貴芯片”。掌握整合多元異構算力的核心技術,是中國確保人工智能安全、可靠、可控的一部分。

他進一步談到,“打開水龍頭,我們可能不知道水是從哪個水庫過來的,只知道它是標準化的自來水。同理,作為算力運營商,我們要調(diào)用不同的基座模型、使用不同的算力芯片,最終為AI企業(yè)提供標準化的算力服務。”

【對話夏立雪】 

澎湃新聞:這兩年大模型技術更迭非??欤磕甓加行陆裹c,你對行業(yè)變化有什么感受?

夏立雪:這兩年人工智能發(fā)展飛速變化,前年我們在討論大語言模型,去年多模態(tài)已經(jīng)進入視野,今年的推理模型大家也習以為常了,技術飛快地迭代。隨著模型能力增強,背后是模型的體量增大。

人工智能依然遵循Scaling Law(尺度定律),對算力的需求越來越大,大到了一個什么程度?大到了你不能再假設你的資源是無限的。前兩年訓練模型的時候,很多大廠有一個基本假設,算力是無限的,至少在做單一任務時算力是無限的。但是,現(xiàn)在這個假設的邊界已經(jīng)逼近,我們需要考慮,中國的算力資源是有限的,怎么去解決模型持續(xù)增長的問題?

DeepSeek提供了一個很好的例子,它沒有用“大力出奇跡”的方式,而是用低成本、高效率的方式,在資源有限的情況下造出了一個好模型。所以,在打造更好的模型方面,現(xiàn)在我們需要更加精細化地把現(xiàn)有算力資源用好。

另外,我們還要考慮供需關系的問題。比如,當很多算力資源被用在模型訓練上,而推理落地的算力需求也在上升,那后者的資源就有限了。這中間,算力資源的供需匹配和性價比是一個很大的挑戰(zhàn)。

當前,我們特別需要把沒有被用起來的算力資源充分利用,同時要確保使用效率高。如果你拿來的算力不好用,大模型跑得非常卡,三秒才出一個字,那沒人愿意用。

2025年5月,上海模速空間,無問芯穹辦公空間一隅。澎湃新聞記者 李佳蔚 圖

澎湃新聞:算力資源有限,是中國特有的還是全球性問題?

夏立雪:大多數(shù)國家都面臨這個問題,只是有些國家會選擇放棄。在AI大模型的賽道上,目前來看主要是中國和美國仍在堅持,隨著模型不斷增大,都會面臨算力資源有限的瓶頸。

澎湃新聞:你提到算力供需錯配,這是怎么回事?這個市場痛點如何解決?

夏立雪:現(xiàn)階段,算力市場的供需錯配是比較明顯的。舉個簡單例子,由于使用習慣問題,大家都優(yōu)先選擇所謂的高質(zhì)量算力,最尖端的GPU,它經(jīng)過市場驗證,一定好用。但問題是,每家企業(yè)都需要用尖端卡嗎?對性能要求不高的企業(yè),用一般性能的GPU行不行?不同企業(yè)需求不同,可以用不同的卡。如果所有企業(yè)都搶最尖端的卡,一方面成本極高,另一方面資源很快短缺。

事實上,市場上還有大量性能不錯,但沒有被關注或接受的算力,我們要讓這些算力都被利用起來。這當中要解決一些問題,比如,這種算力和模型是不是適配,企業(yè)會不會用。異構卡出于不同的設計理念,會有很多性能差異,適配不同的任務,因此多種不同類型的卡展現(xiàn)出的效率差異會導致大規(guī)模分布式訓練變得低效。

我們有一個公式,AI模型的算力=芯片算力×優(yōu)化系數(shù)×多元異構能力。其中,優(yōu)化系數(shù)是通過軟硬件協(xié)同發(fā)揮芯片算力最大價值的能力;多元異構,則是讓不同類型的算力資源都進入算力池,并實現(xiàn)算力適配的能力。

打開水龍頭,我們可能不知道水是從哪個水庫過來的,只知道它是標準化的自來水。同理,作為算力運營商,我們要調(diào)用不同的基座模型、使用不同的算力芯片,最終為AI企業(yè)提供標準化的算力服務。

2025年5月,上海模速空間,無問芯穹成立2周年的一處照片墻。澎湃新聞記者 李佳蔚 圖

澎湃新聞:既然AI任務變得越來越多樣化,芯片技術也越來越細分,是不是意味著算力應該用在最適合它的地方?

夏立雪:是的,企業(yè)手里有算力,一定要把它用好。算力需求本身是分層的,供給也應該分層。一些芯片更適合承擔大模型訓練的高吞吐任務,另一些則在低延遲、低功耗的推理場景中更有優(yōu)勢,還有些專為端側(cè)部署設計,追求輕量化,實時響應。不同類型的AI應用,匹配最適合的算力資源,才能在性能、效率與成本之間找到最優(yōu)解。

澎湃新聞:能否解釋一下,在龐大的AI產(chǎn)業(yè)當中,你們具體提供怎樣的產(chǎn)品和服務?

夏立雪:就像剛才說的,我們有點像一個“自來水廠”,從不同水庫調(diào)取水源,經(jīng)過統(tǒng)一標準化的處理,再供給到千家萬戶。我們也像是大模型算力的電商平臺,你要部署AI應用,可以像在電商平臺上購物一樣,在我們這里選擇不同芯片、不同模型,選購最適合自己的組合套餐。最終,我們希望讓更多的企業(yè)能用得起算力,也用得好算力。

目前,無問芯穹擁有全球首個可進行單任務千卡規(guī)模異構芯片混合訓練的平臺,支持包括華為昇騰、天數(shù)智芯、沐曦、摩爾線程與AMD、NVIDIA六種異構芯片在內(nèi)的大模型混合訓練,集群算力利用率最高可達97.6%。

澎湃新聞:你是清華博士,也是“90后”,你怎么看如今越來越多的科學家和年輕人投身AI行業(yè)?

夏立雪:這兩個問題在人工智能行業(yè)是有統(tǒng)一性的。也就是說,科學家創(chuàng)業(yè)和年輕人創(chuàng)業(yè),在人工智能行業(yè)很普遍,也很匹配。人工智能是一個快速迭代的技術體系,現(xiàn)在很多技術都來不及寫書、來不及成為教材,就已經(jīng)被廣泛應用起來了。和傳統(tǒng)上我們先在學校學習,然后才進入行業(yè)應用的模式非常不同。

我們公司平均年齡只有32歲,比我更小,如果算上實習生,那平均年齡才28歲。2023年我們公司推出的第一個在業(yè)界打響名氣的推理加速方法FlashDecoding++,通過異步方法實現(xiàn)注意力計算的真正并行,它就是一個年僅24歲的實習生作為主要貢獻者實現(xiàn)的,那年她也拿到了我們公司最高榮譽“無穹之星”。所以在這個行業(yè),年輕人大有可為。

澎湃新聞:來到上海,你對這座城市以及這里的人工智能發(fā)展環(huán)境有什么感受?

夏立雪:北京、上海都是人工智能很強的城市,有各自不同的優(yōu)勢。上海確確實實讓我有很大的一個感觸,就是它和年輕人的匹配,可能因為它的文化基因更加開放、更加活潑,年輕人生活工作在其中比較舒適。這種環(huán)境既有利于創(chuàng)新,也吸引了大量人工智能企業(yè)的聚集。

澎湃新聞:無問芯穹是否有融資壓力,考慮上市嗎?

夏立雪:我們有自己的技術理想,同時也考慮商業(yè)化落地。從公司發(fā)展角度,一方面我們會繼續(xù)堅持一套自主、可控的技術方向,符合且服務國家需求;另一方面,我們不是一家研究院,我們樂于追求商業(yè)價值,不僅僅是給股東交答卷,更是要讓技術接受市場的驗證。我相信只要堅持做好兩件事,既有技術的持續(xù)領先,又有商業(yè)化的成功,上市只是一個水到渠成的事情。

澎湃新聞:無問芯穹是首批入駐模速空間的企業(yè),講一個你對模速空間的深刻印象吧。

夏立雪:我們公司和模速空間共同成長,感情很深。模速空間為我們提供了全方位的貼心服務,并給予了大力支持。這里聚集了大量人工智能上下游企業(yè),我經(jīng)常上樓找其他同行聊一聊天,相互交換一些行業(yè)早期的信息和判斷,這對各自發(fā)展都有好處。另外,我們很多合作也是這樣達成的,有時模速空間兩家企業(yè)相互合作,有時我們攜手去服務外部的另一個客戶。在這里,機遇非常多。

    責任編輯:徐禎曜
    圖片編輯:李晶昀
    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司

            新乡县| 鹿邑县| 珠海市| 武功县| 正安县| 济阳县| 扎赉特旗| 木兰县| 香河县| 清水县| 灵武市| 韶山市| 忻州市| 福贡县| 霍邱县| 措美县| 顺昌县| 青海省| 绥江县| 赣榆县| 西宁市| 郎溪县| 城步| 舞阳县| 顺义区| 舞钢市| 古浪县| 仙居县| 梅州市| 观塘区| 吉林省| 云阳县| 长武县| 盐山县| 闽清县| 云阳县| 海淀区| 呼伦贝尔市| 车致| 镇江市| 平邑县|