- +1
再等等梁文鋒
都說梁文鋒變了。
在備受矚目的DeepSeek V4發(fā)布前夕,DeepSeek首輪融資浮出水面——據(jù)悉,DeepSeek正以約100億美元估值尋求新一輪融資。然而一年前,梁文鋒明確表示對(duì)商業(yè)化不感興趣,拒絕了一批試圖洽談融資的人。
那時(shí)正逢DeepSeek初芒乍現(xiàn)。2025年1月,DeepSeek R1發(fā)布,彼時(shí)英偉達(dá)單日狂瀉17%,市值蒸發(fā)近6000億美元。這場(chǎng)極其優(yōu)雅的東方開源革命,以超低成本帶來頂尖模型,此后DeepSeek及梁文鋒聲名鵲起。
只是時(shí)過境遷,眼下大模型江湖日卷夜囂,世界變化緊湊劇烈,DeepSeek卻遲遲未拿出外界苦等的續(xù)作。
有人開始著急,有人開始懷疑,但持續(xù)封神的敘事對(duì)任何人都是一種負(fù)擔(dān)。
如無意外,DeepSeek V4本周即將登場(chǎng)。AI圈注定不會(huì)平靜。
梁文鋒保持沉默
“任何事情在你懷疑并想突破它的時(shí)候,是最吸引人的階段”,《三體》中如此寫道。
這正如今天人們對(duì)DeepSeek的期待。
自2025年初以來,國(guó)內(nèi)智譜、MiniMax、Kimi以及字節(jié)、阿里等在Agent和coding強(qiáng)化上已經(jīng)更新了數(shù)版模型,春節(jié)“百模大戰(zhàn)”一幕更是歷歷在目,造就覆蓋文本、圖像、視頻多模態(tài)的AI最強(qiáng)春節(jié)檔。
但DeepSeek仿佛不問戰(zhàn)事。
至今,多次傳聞要上線的DeepSeek V4還是沒有來。有人戲言,“DeepSeek已成Next Week?!?/p>
不可否認(rèn),外界對(duì)DeepSeek的好奇、關(guān)心從來不減。最近一次DeepSeek關(guān)于模型動(dòng)態(tài)的推文官宣,則停留在2025年12月初,彼時(shí)其發(fā)布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
其實(shí)水面之下,并非沒有新鮮事:今年1月,DeepSeek團(tuán)隊(duì)連續(xù)發(fā)布了兩篇由梁文鋒署名的論文,mHC(流形約束超連接)及Engram(條件記憶),瞄準(zhǔn)對(duì)大模型長(zhǎng)序列處理的提升。4月8日凌晨,DeepSeek悄悄上線了分層模式界面,出現(xiàn)快速模式和專家模式兩個(gè)入口,甚至還埋下了一個(gè)視覺模式的新選項(xiàng)。
一切都隱隱被解讀為:V4快了。
有爆料稱,DeepSeek創(chuàng)始人梁文鋒近日在內(nèi)部溝通中透露,DeepSeek新一代旗艦大模型DeepSeek V4將于4月下旬正式發(fā)布。依然,DeepSeek官方?jīng)]有澄清,沒有回應(yīng)。這風(fēng)格,相當(dāng)“DeepSeek”。
任江湖喧囂鼎沸,無論是梁文鋒還是DeepSeek團(tuán)隊(duì),與外界的互動(dòng)從來都克制。
這種克制足夠深入,一位AI獵頭就聊起:有認(rèn)識(shí)的大廠員工跳槽去DeepSeek后就“失聯(lián)”了,再也沒回復(fù)過微信。投資界此前和一位DeepSeek研究員交流,聊及公司,一律保持緘默。
人們?yōu)槭裁雌诖齎4
DeepSeek此前堅(jiān)定不融資。
多年前,中國(guó)前首富陳天橋曾與梁文鋒對(duì)談四小時(shí),然后梁文鋒婉拒了陳天橋的投資。2024年初,聯(lián)想創(chuàng)投也找到梁文鋒想投一筆錢,但同樣無果。
再后來,無論大模型江湖融資如何熱鬧非凡,DeepSeek融資通道始終緊閉。甚至一度有消息稱:梁文鋒不急于獲得投資,擔(dān)心外部投資者會(huì)干預(yù)DeepSeek的決策。
專注,低調(diào),不太做沒把握的事——梁文鋒及DeepSeek給外界留下如此印象。
依稀記得2025年初,DeepSeek R1橫空出世,在純強(qiáng)化學(xué)習(xí)激發(fā)推理能力這條路徑上開創(chuàng)了先河,它向世界宣告著:中國(guó)能夠以極低成本做出世界級(jí)的模型。
更優(yōu)雅的是,還是開源的。
以至于2025年的精彩仿佛就是由“DeepSeek時(shí)刻”開啟,這年中國(guó)大模型江湖迅速崛起和急劇變化,不僅是價(jià)格戰(zhàn)與開源潮襲來,競(jìng)爭(zhēng)路線也開始高度集中在AI編程和多模態(tài)。
時(shí)至今日,開源者DeepSeek依然無可避免寄托著中國(guó)人工智能的厚望,誠(chéng)如今天外界對(duì)DeepSeek V4的期冀。
如無意外,本周,DeepSeek將推出新一代大模型DeepSeek V4。此時(shí),距離上一次重大版本更新已經(jīng)過去15個(gè)月。
此前有市場(chǎng)傳聞,DeepSeek V4不僅將帶來萬億參數(shù)規(guī)模和百萬級(jí)上下文窗口,更首次實(shí)現(xiàn)與華為昇騰等國(guó)產(chǎn)芯片的深度適配,標(biāo)志著中國(guó)AI產(chǎn)業(yè)在去CUDA化道路上邁出關(guān)鍵一步。
一個(gè)細(xì)節(jié)是,2025年DeepSeek V3發(fā)布時(shí),就有開發(fā)者發(fā)現(xiàn)模型代碼里出現(xiàn)了大量PTX(Parallel Thread Execution)指令的蹤跡——這是英偉達(dá)GPU的匯編語言,比CUDA更底層,當(dāng)時(shí)市場(chǎng)就開始猜測(cè):DeepSeek在修煉脫離CUDA的內(nèi)功。
隱隱約約,梁文鋒依然是那個(gè)要做出創(chuàng)新的人。
中國(guó)AI敘事沸騰
別催梁文鋒
短短一年,中國(guó)AI敘事翻天覆地。
應(yīng)用端的繁榮肉眼可見。國(guó)家數(shù)據(jù)局3月一則數(shù)據(jù)顯示,中國(guó)日均Token調(diào)用量已突破140萬億,較兩年前的1000億增長(zhǎng)超過1400倍。
這帶來了全產(chǎn)業(yè)鏈的景氣:Kimi、智譜、Minimax等大模型商,還有阿里、字節(jié)等各大云廠商,以及芯片層、服務(wù)器層、算力調(diào)度層的參與者,無一不在積極承接這波需求沖擊。
因此,一種聲音翻涌得更加厲害:DeepSeek應(yīng)該趁現(xiàn)在來一波大的。
但天下英雄如過江之鯽,巨大機(jī)會(huì)敞口意味著更激烈的競(jìng)爭(zhēng)。就在這個(gè)傳聞V4將發(fā)布的4月,由姚順宇統(tǒng)籌的混元大模型也將發(fā)布HY 3.0,內(nèi)部稱之為:混元系列重大版本迭代。
可以感受到,DeepSeek本身壓力也在顯現(xiàn)——2026年開年來,DeepSeek上演了至少7次大規(guī)模服務(wù)中斷,例如3月29日晚至當(dāng)月30日上午,其網(wǎng)頁端與APP端同時(shí)無法使用,宕機(jī)時(shí)間持續(xù)約12小時(shí)。
以及肉眼可見的人才流失。2025年底至2026年初,DeepSeek有郭達(dá)雅、魏浩然、王炳宣、阮翀、羅福莉等多名核心研發(fā)骨干離開。當(dāng)這次傳出DeepSeek融資,市場(chǎng)也不可避免想到:DeepSeek不融資就沒有市場(chǎng)估值錨點(diǎn),無法給拿了期權(quán)的核心員工吃下定心丸。
而對(duì)于令人興奮的適配國(guó)產(chǎn)芯片消息,亦是一項(xiàng)成本極高而沉重的重寫工程。外界幾乎一致認(rèn)為,DeepSeekV4多次跳票,就與重寫底層代碼試圖適配國(guó)產(chǎn)芯片密切相關(guān)。
“我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚?!绷何匿h曾如此坦言。此時(shí)此刻,或許更不該讓曾無意成為鯰魚的DeepSeek,承擔(dān)商業(yè)世界的慕強(qiáng)敘事。
不可否認(rèn),DeepSeek曾真真切切給中國(guó)AI帶來破壁時(shí)刻。無論DeepSeek能否再給世人以震撼,它所展現(xiàn)的世界觀和方法論,都極大支撐了對(duì)通用大模型的理解甚至對(duì)頂尖人才的理解。
不妨再給DeepSeek一些耐心。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




