- +1
姚順雨加盟后首交“成績(jī)單”,騰訊混元Hy3 preview模型發(fā)布
騰訊混元“重建”后首次發(fā)布大模型。
4月23日,騰訊混元 Hy3 preview 語(yǔ)言模型發(fā)布并開源。這是一個(gè)快慢思考融合的混合專家模型,總參數(shù)295B,激活參數(shù)21B,最大支持256K上下文長(zhǎng)度。這是混元重建后訓(xùn)練的第一個(gè)模型,也是混元迄今最智能的模型,在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體等能力及推理性能上實(shí)現(xiàn)大幅提升。
值得注意的是,這是騰訊混元在去年重建后,首次對(duì)外披露大模型。去年12月17日,澎湃新聞?dòng)浾吡私獾?,騰訊升級(jí)大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺(tái)部,全面強(qiáng)化其大模型的研發(fā)體系與核心能力。姚順雨(Vinces Yao)出任“CEO/總裁辦公室”首席AI科學(xué)家,向騰訊總裁劉熾平匯報(bào);同時(shí)兼任AI Infra部、大語(yǔ)言模型部負(fù)責(zé)人,向技術(shù)工程事業(yè)群總裁盧山匯報(bào)。
這也是年僅28歲的“AI天才少年”姚順雨出任騰訊首席AI科學(xué)家后,對(duì)外交出的第一張“成績(jī)單”。
去年9月12日,騰訊官方公眾號(hào)“鵝廠黑板報(bào)”曾發(fā)文辟謠,近日有傳聞稱OpenAI前研究員姚順雨上億薪資入職騰訊,該傳聞不實(shí)。
據(jù)公開資料,姚順雨畢業(yè)于清華大學(xué)姚班,清華姚班是清華大學(xué)計(jì)算機(jī)科學(xué)實(shí)驗(yàn)班的簡(jiǎn)稱,由世界著名計(jì)算機(jī)科學(xué)家姚期智院士于2005年創(chuàng)辦,旨在培養(yǎng)國(guó)際頂尖的計(jì)算機(jī)科學(xué)及交叉創(chuàng)新人才。姚順雨曾任姚班聯(lián)席會(huì)主席,還是清華大學(xué)學(xué)生說唱社聯(lián)合創(chuàng)始人。
2024年,姚順雨加入OpenAI,參與智能體產(chǎn)品operator與deep research開發(fā),是項(xiàng)目的核心貢獻(xiàn)者。在前期研究過程中,他為語(yǔ)言智能體方向的開啟和發(fā)展做出了基礎(chǔ)性貢獻(xiàn)。
2025年5月23日,《麻省理工科技評(píng)論》“35歲以下科技創(chuàng)新35人”中國(guó)區(qū)名單發(fā)布,當(dāng)時(shí)27歲的姚順雨入選,成為最年輕的入選者。
據(jù)騰訊方面向記者介紹,今年2月,騰訊混元重建預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)的基礎(chǔ)設(shè)施,以及模型追求實(shí)用性的三個(gè)原則:
第一:能力體系化: 不推崇“偏科”,因?yàn)榧词故谴a智能體的單一應(yīng)用,也涉及推理、長(zhǎng)文、指令、對(duì)話、代碼、工具等多種能力的深度協(xié)同。
第二:評(píng)測(cè)真實(shí)性: 主動(dòng)跳出易被“刷榜”的公開榜單,通過自建題目、最新考試、人工評(píng)測(cè)、產(chǎn)品眾測(cè)等多種方式評(píng)估和改進(jìn)模型的“真實(shí)戰(zhàn)斗力”。
第三:性價(jià)比追求:實(shí)用性離不開商業(yè)合理性,深度協(xié)同模型架構(gòu)和推理框架的設(shè)計(jì),大幅降低任務(wù)成本,讓智能用得起、用得好。
根據(jù)公開資料顯示,代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預(yù)訓(xùn)練及強(qiáng)化學(xué)習(xí)框架的重建和強(qiáng)化學(xué)習(xí)任務(wù)規(guī)模的提升,混元團(tuán)隊(duì)以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準(zhǔn)以及 BrowseComp、WideSearch 等主流搜索智能體基準(zhǔn)中取得了強(qiáng)競(jìng)爭(zhēng)力的結(jié)果。
目前,Hy3 preview 已和騰訊旗下眾多產(chǎn)品形成聯(lián)動(dòng):在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發(fā)上線,微信公眾號(hào)、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等也在陸續(xù)上線。另外,Hy3 preview 支持接入流行的開源智能體產(chǎn)品,如 OpenClaw、OpenCode、KiloCode 等,并已上架騰訊云大模型服務(wù)平臺(tái) TokenHub。
多個(gè)測(cè)評(píng)結(jié)果顯示,Hy3 preview 模型整體推理效率提升40%,成本相比上一代模型大幅下降。
價(jià)格方面,在騰訊云大模型服務(wù)平臺(tái) TokenHub 上,Hy3 preview 輸入價(jià)格最低1.2元/百萬tokens,輸入命中緩存價(jià)格0.4元/百萬tokens,輸出價(jià)格最低4元/百萬tokens。同時(shí),騰訊云聯(lián)合混元推出定制的 Hy3 preview Token Plan 套餐,個(gè)人版定價(jià)最低28元/月,為Agent開發(fā)和打造“龍蝦”應(yīng)用的提供更具性價(jià)比選擇。
此次Hy3 preview發(fā)布,引發(fā)外界期待,也再次激發(fā)國(guó)內(nèi)AI競(jìng)速,今年4月,除了混元大模型,另一款國(guó)產(chǎn)大模型無疑是外界翹首以盼的DeepSeek V4。據(jù)網(wǎng)絡(luò)傳言,V4將在4月正式發(fā)布,盡管Deep Seek不斷有更新動(dòng)作,但其具體進(jìn)度仍然保持神秘。
4月22日,據(jù)外媒報(bào)道,中國(guó)科技巨頭騰訊控股和阿里集團(tuán)正在洽談投資DeepSeek,這家人工智能新興公司最近首次開始籌資。一位知情人士透露,DeepSeek目前正尋求以超過200億美元估值籌集資金。
不過有知情人士向澎湃新聞?dòng)浾呙鞔_否認(rèn)了上述消息,并表示相關(guān)傳言不實(shí)。截至發(fā)稿,騰訊和阿里并未回應(yīng)此事。
快思慢想研究院院長(zhǎng)、特邀評(píng)論員田豐告訴澎湃新聞?dòng)浾?,目前?guó)產(chǎn)大模型在商業(yè)估值上仍有很大想象空間,據(jù)斯坦福大學(xué)發(fā)布的《2026年人工智能指數(shù)報(bào)告》分析,當(dāng)前中美頂級(jí)模型的性能差異僅2.7%,但是OpenAI年化收入已超240億美元,Anthropic年化營(yíng)收300億美元,埋頭做基礎(chǔ)研發(fā)的DeepSeek至今仍沒有商業(yè)化目標(biāo)、商業(yè)化產(chǎn)品,所以從商業(yè)價(jià)值出發(fā)雙方估值相差較大。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




