9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

27歲掌舵騰訊大模型,非典型天才定義AI下半場(chǎng)

2025-12-23 16:35
來(lái)源:澎湃新聞·澎湃號(hào)·政務(wù)
字號(hào)

2015年,以安徽省理科第三名的成績(jī)考入清華大學(xué)交叉信息研究院“姚班”;2019年,遠(yuǎn)赴美國(guó)普林斯頓大學(xué)深造,專(zhuān)攻自然語(yǔ)言處理與強(qiáng)化學(xué)習(xí);2024年,加入OpenAI,為其首批智能體產(chǎn)品Operator、Deep research的開(kāi)發(fā)作出了核心貢獻(xiàn);2025年,出任騰訊首席AI科學(xué)家,同時(shí)兼任AI Infra部及大語(yǔ)言模型部負(fù)責(zé)人,掌舵騰訊AI基礎(chǔ)設(shè)施與大模型研發(fā)的核心業(yè)務(wù)。

這是姚順雨的十年。從17歲到27歲,他用十年活成了大眾眼中“學(xué)霸流”小說(shuō)中的男主模板。但在他看來(lái),他想做的就兩條線——簡(jiǎn)單通用的方法、有實(shí)際價(jià)值的任務(wù)?!斑@些任務(wù)往往是如何在真實(shí)數(shù)字世界創(chuàng)造新的價(jià)值。這是一塊處女地,是一個(gè)巨大的寶藏。我只是恰好挖掘到了一些東西?!币樣暾f(shuō)。

姚順雨

“乖”學(xué)生在攀登

在姚順雨刷屏的這幾天,我們接收到了不少關(guān)于他的信息:16歲拿到全國(guó)信息學(xué)奧林匹克競(jìng)賽(NOI)銀牌;在高考考場(chǎng)上睡著了,丟了十幾分,錯(cuò)失“狀元”;參與聯(lián)合創(chuàng)辦清華大學(xué)學(xué)生說(shuō)唱社,在網(wǎng)易云發(fā)布了20余首說(shuō)唱作品;以最年輕入選者身份躋身《麻省理工科技評(píng)論》“35歲以下科技創(chuàng)新35人”中國(guó)區(qū)名單……

看起來(lái)像一個(gè)“對(duì)抗路”天才,但姚順雨本人不這么想,回望來(lái)時(shí)路,他用“非常乖”來(lái)形容自己,所走過(guò)的每一步都是按部就班、順其自然?!霸谝Π?,大家會(huì)希望去美國(guó)讀博,我就去考了普林斯頓大學(xué)。博士畢業(yè)后,OpenAI是做研究最好的地方,我就加入了OpenAI?!彼f(shuō)。但顯然,這一路走來(lái),也沒(méi)有真的如此輕描淡寫(xiě)。

在公開(kāi)信息中,“智能體”(Agent),是姚順雨研究生涯中最重要的關(guān)鍵詞。不過(guò),最初進(jìn)入清華姚班時(shí),他學(xué)習(xí)的是理論計(jì)算科學(xué)。“當(dāng)時(shí),我覺(jué)得很多重要理論問(wèn)題已經(jīng)解決得差不多了,比如將某個(gè)圖算法的復(fù)雜度從n的2.83次方優(yōu)化到n的2.82次方,這種改進(jìn)在現(xiàn)實(shí)中意義不大。”直到2016年的一節(jié)課上,老師在講授多模態(tài)嵌入時(shí),展示了一個(gè)例子:“king(國(guó)王)”的向量 ? “man(男人)”的向量 + “queen(王后)”的向量 ≈ “woman(女人)”的向量。這讓姚順雨第一次意識(shí)到,深度學(xué)習(xí)在語(yǔ)義表示上居然能做出如此驚艷的計(jì)算。但當(dāng)時(shí)“姚班”在深度學(xué)習(xí)領(lǐng)域的師資有限,他沒(méi)能第一時(shí)間投入相關(guān)學(xué)習(xí)。2018年,按照“姚班”傳統(tǒng),姚順雨前往麻省理工學(xué)院進(jìn)行海外交流,開(kāi)始從計(jì)算機(jī)視覺(jué)切入,系統(tǒng)開(kāi)展深入學(xué)習(xí)研究。2019年,他考入普林斯頓大學(xué)攻讀博士學(xué)位,專(zhuān)攻計(jì)算機(jī)視覺(jué)專(zhuān)業(yè)。

但是,經(jīng)過(guò)此前的學(xué)習(xí),姚順雨認(rèn)為計(jì)算機(jī)視覺(jué)很難實(shí)現(xiàn)通用的智能,直覺(jué)告訴他,語(yǔ)言將是一個(gè)更核心、更有潛力的方向。于是,他開(kāi)始尋求轉(zhuǎn)換方向,并與普林斯頓大學(xué)副教授卡提克·納拉辛漢(Karthik Narasimhan)相遇。

卡提克有一個(gè)著名的代表性成果——生成式預(yù)訓(xùn)練(GPT)開(kāi)山之作,即GPT-1論文第二作者。此前,卡提克曾經(jīng)利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在一個(gè)小規(guī)模文字游戲中訓(xùn)練智能體進(jìn)行簡(jiǎn)單的動(dòng)態(tài)交互。在經(jīng)過(guò)一番頭腦風(fēng)暴后,兩人認(rèn)為完全可以利用更強(qiáng)大的模型,如GPT-2,來(lái)進(jìn)行更復(fù)雜的語(yǔ)言游戲訓(xùn)練,以探討智能體中新的可能性。

這在當(dāng)時(shí)并不是一個(gè)討巧的方向。智能體研究尚屬冷門(mén),更多人選擇以問(wèn)答、翻譯等主流任務(wù)進(jìn)行研究。但姚順雨認(rèn)為,要下注不用的方向才能產(chǎn)生超越。他更希望探索新的、根本性的研究,創(chuàng)造完全不同的產(chǎn)品形態(tài),即便失敗了,起碼探索了不一樣的東西。對(duì)他而言,這也會(huì)“更有意思”。

姚順雨(前排右一)參與嘻哈單曲《水木道》MV拍攝

追求智能體“泛化”

從廣義AI背景出發(fā),智能體是一個(gè)非常古老的概念。任何能進(jìn)行自我決策、與環(huán)境交互,并試圖優(yōu)化獎(jiǎng)勵(lì)的系統(tǒng)都可以被稱(chēng)為智能體。姚順雨曾嘗試梳理廣義智能體的發(fā)展脈絡(luò)——

在“符號(hào)主義”盛行階段,業(yè)內(nèi)強(qiáng)調(diào)規(guī)則推理,并嘗試通過(guò)專(zhuān)家系統(tǒng)將所有規(guī)則寫(xiě)出來(lái),結(jié)果發(fā)現(xiàn)這根本難以覆蓋復(fù)雜世界,從而導(dǎo)致了第一次AI寒冬。

進(jìn)入深度強(qiáng)化學(xué)習(xí)階段后,以神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的智能體在視頻游戲、圍棋等環(huán)境中取得重要突破,最具代表性的便是阿爾法狗(AlphaGo),但即便它能夠打敗柯潔等人類(lèi)圍棋高手,也存在一個(gè)缺陷,圍棋智能體只能下圍棋,它沒(méi)辦法玩別的游戲。這意味著,智能體仍然無(wú)法實(shí)現(xiàn)泛化。

當(dāng)智能體步入大語(yǔ)言模型驅(qū)動(dòng)時(shí),則出現(xiàn)了新的特點(diǎn)。由于語(yǔ)言本身就是人類(lèi)為了泛化而發(fā)明的工具,天然攜帶推理基因,能夠跨環(huán)境遷移,包括編程、互聯(lián)網(wǎng)、電腦操作等更接近真實(shí)世界的數(shù)字環(huán)境。

換而言之,姚順雨認(rèn)為語(yǔ)言是實(shí)現(xiàn)通用智能體的“先天圣體”。不過(guò),要讓語(yǔ)言模型真正“活”起來(lái),也沒(méi)有那么容易。

在姚順雨的研究中,GPT是一柄利刃。如今,GPT早已耳熟能詳,但在姚順雨剛切入研究時(shí),另一種語(yǔ)言預(yù)訓(xùn)練模型BERT才是主流。但姚順雨發(fā)現(xiàn),BERT欠缺在開(kāi)放行為空間的決策能力,而GPT則明顯更符合他的研究調(diào)性?;诓粩噙M(jìn)階迭代的GPT等新模型技術(shù),姚順雨也在不斷進(jìn)步。起初,他按照頭腦風(fēng)暴的點(diǎn)子,在文字游戲上發(fā)力,不久后就意識(shí)到,文字游戲局限性太強(qiáng),要想有進(jìn)一步突破,還需要更加開(kāi)放的環(huán)境。從此,他就一直在建立語(yǔ)言智能體與世界之間的互動(dòng)上拓展維度。他提出的思維樹(shù)(Tree of Thoughts)框架改進(jìn)決策模型,構(gòu)建了CoALA模塊化認(rèn)知架構(gòu);提出的ReAct方法首次引入“推理—行動(dòng)”結(jié)合的智能體范式,為創(chuàng)建具備通用性、可擴(kuò)展性的語(yǔ)言智能體奠定了基礎(chǔ)。

“我自己最喜歡的工作是ReAct?!币樣瓯硎荆琑eAct的核心理念是讓大語(yǔ)言模型在行動(dòng)前先進(jìn)行可解釋的內(nèi)在推理,繼而基于推理結(jié)論去決策與操作。這一思路不但增強(qiáng)了模型的可控性,也極大拓展了其在各類(lèi)實(shí)際領(lǐng)域中的適用能力。如今,ReAct已成為世界范圍內(nèi)構(gòu)建語(yǔ)言智能體的最主流方法,被學(xué)術(shù)界與工業(yè)界廣泛采納。

“我一直追求‘簡(jiǎn)單且通用’的方法,很多人花大力氣設(shè)計(jì)復(fù)雜架構(gòu),只在某個(gè)任務(wù)上奏效,我希望找到能泛化到多任務(wù)的簡(jiǎn)單解法?!币樣暾f(shuō)。他表示,最終的智能邊界,是由不同交互方式?jīng)Q定的,而不是由單一模型決定的,其中的想象空間非常大?!罢Z(yǔ)言無(wú)法推理一切,有必要將多模態(tài)能力納入語(yǔ)言智能體框架中?!痹谝樣暄壑?,現(xiàn)在的智能體就像一個(gè)數(shù)字化實(shí)習(xí)生,在繼續(xù)突破的路上,還大有可為。

“歡迎來(lái)到下半場(chǎng)”

2024年8月,姚順雨加入OpenAI,擔(dān)任研究科學(xué)家,專(zhuān)注于將大型語(yǔ)言模型從理論研究推向?qū)嶋H應(yīng)用,主導(dǎo)開(kāi)發(fā)了OpenAI 首個(gè)發(fā)布的智能體模型及產(chǎn)品,同時(shí)參與了Deep Research項(xiàng)目。作為冉冉升起的新星,姚順雨的表現(xiàn)備受矚目,因此,當(dāng)2025年9月第一次傳出他將加盟騰訊的消息時(shí),就引起了關(guān)注,近日騰訊的公告又讓他持續(xù)刷屏。雖然“億元薪資”被辟謠,但加盟騰訊已成定局。

近年來(lái),騰訊在人工智能上重點(diǎn)發(fā)力,尤其圍繞混元大模型訓(xùn)練,以及海量業(yè)務(wù)場(chǎng)景的深度實(shí)踐,積累了系統(tǒng)化的工程能力。今年,為優(yōu)化人工智能戰(zhàn)略布局,騰訊新成立了AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部,全面強(qiáng)化其大模型的研發(fā)體系與核心能力。姚順雨挑大梁的AI Infra部,將負(fù)責(zé)大模型訓(xùn)練和推理平臺(tái)技術(shù)能力建設(shè),聚焦大模型分布式訓(xùn)練、高性能推理服務(wù)等核心技術(shù)能力,為大模型算法研發(fā)和業(yè)務(wù)場(chǎng)景落地提供穩(wěn)定高效的技術(shù)支持和服務(wù)。

對(duì)姚順雨來(lái)說(shuō),這與他對(duì)“下半場(chǎng)”的判斷是相符的。早在上半年,他撰文稱(chēng),包括Deep Blue、AlphaGo、GPT-4等在內(nèi),這些能被寫(xiě)進(jìn)教科書(shū)的里程碑,背后都依托AI方法的根本性創(chuàng)新,隨著搜索、深度強(qiáng)化學(xué)習(xí)、規(guī)?;屯评砟芰Φ牟粩喟l(fā)展,“強(qiáng)化學(xué)習(xí)終于具備了泛化能力”。

“哪怕就在一年前,如果你告訴大多數(shù) AI 研究者一份單一的配方可以同時(shí)搞定軟件工程、創(chuàng)意寫(xiě)作、IMO級(jí)數(shù)學(xué)、鍵盤(pán)鼠標(biāo)操作以及長(zhǎng)篇問(wèn)答——他們肯定會(huì)笑你‘幻覺(jué)’。這些任務(wù)各自極難,許多研究者整個(gè)博士階段可能只盯著其中一個(gè)小方向。然而,它真的發(fā)生了?!币樣陮?xiě)道。他極為自信地表示,這意味著AI的下半場(chǎng)來(lái)臨,在新時(shí)代,評(píng)價(jià)會(huì)比訓(xùn)練更重要,研究者應(yīng)該將重心從“解決問(wèn)題”轉(zhuǎn)向“定義問(wèn)題”,“像產(chǎn)品經(jīng)理那樣思考”。

無(wú)獨(dú)有偶,幾個(gè)月前,姚順雨就在采訪中面對(duì)過(guò)“如何在微信里做智能體”的問(wèn)題。當(dāng)時(shí),姚順雨表示,微信是一個(gè)易守難攻的平臺(tái),他會(huì)先觀察是否有更新的交互方式,而非貿(mào)然“進(jìn)攻”?!罢嬲奈kU(xiǎn),不是一個(gè)類(lèi)似于微信的東西打敗了微信,而是一個(gè)很不一樣的東西打敗了微信。”彼時(shí),他已經(jīng)有了“產(chǎn)品經(jīng)理”的思考方式。

姚順雨曾經(jīng)打過(guò)一個(gè)比方:AI前半場(chǎng),玩家是在電子游戲和考試?yán)锼⒎?;下半?chǎng),玩家則有機(jī)會(huì)把智能做成真正有用的產(chǎn)品。前半場(chǎng)充斥著增量模型和方法;在下半場(chǎng),它們會(huì)被配方“過(guò)濾”——除非你創(chuàng)造新假設(shè)來(lái)打破配方,否則注定被碾壓。

如今,看姚順雨如何玩轉(zhuǎn)下半場(chǎng)的時(shí)刻到了。姚順雨,歡迎你來(lái)到下半場(chǎng)。

?

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司

            乌兰浩特市| 延长县| 石城县| 南城县| 绍兴市| 务川| 富民县| 阳朔县| 上犹县| 彩票| 建水县| 灵宝市| 唐山市| 迭部县| 汝南县| 耿马| 綦江县| 克山县| 青铜峡市| 南充市| 北票市| 丰顺县| 天祝| 远安县| 泽库县| 普陀区| 白玉县| 靖宇县| 宜都市| 略阳县| 伊春市| 沙洋县| 博乐市| 阿荣旗| 黄冈市| 水城县| 曲沃县| 南部县| 墨玉县| 涞源县| 扶余县|