OpenAI又開源了：推出兩個(gè)能在筆記本和手機(jī)上運(yùn)行的開源模型

澎湃新聞?dòng)浾?張靜

2025-08-06 13:47

來(lái)源：澎湃新聞

聽全文

當(dāng)?shù)貢r(shí)間8月5日，OpenAI推出自GPT-2以來(lái)的首批開源權(quán)重語(yǔ)言模型gpt-oss-120b與gpt-oss-20b，性能堪比o4-mini和o3-mini，可在高端筆記本和手機(jī)上運(yùn)行。

OpenAI重新?lián)肀ч_源，該公司表示，發(fā)布開源系統(tǒng)的部分原因是，一些企業(yè)和個(gè)人更傾向于在自有計(jì)算機(jī)硬件上運(yùn)行這類技術(shù)?！伴_源模型與我們的托管模型形成互補(bǔ)，為開發(fā)者提供了更豐富的工具選擇?！边@有助于加速推進(jìn)AI前沿研究，降低新興市場(chǎng)、資源受限行業(yè)及小型組織的使用門檻。

OpenAI總裁、創(chuàng)始人之一的格雷格·布羅克曼（Greg Brockman）說(shuō)，“如果我們提供一款模型，人們就會(huì)用我們的技術(shù)。他們會(huì)依賴我們實(shí)現(xiàn)下一次突破。他們會(huì)給我們反饋、提供數(shù)據(jù)，以及改進(jìn)模型所需的各種信息。這有助于我們?nèi)〉眠M(jìn)一步的進(jìn)展?！?/p>

推出開源模型，可在手機(jī)運(yùn)行

gpt-oss模型是OpenAI自2019年推出GPT-2以來(lái)發(fā)布的首批開源權(quán)重語(yǔ)言模型。OpenAI表示，gpt-oss-120b與gpt-oss-20b突破開源權(quán)重推理模型的邊界，在推理任務(wù)上的表現(xiàn)優(yōu)于同規(guī)模開源模型，能以低成本實(shí)現(xiàn)實(shí)際應(yīng)用性能，經(jīng)過(guò)優(yōu)化可在消費(fèi)級(jí)硬件上高效部署。模型訓(xùn)練過(guò)程結(jié)合了強(qiáng)化學(xué)習(xí)技術(shù)，并借鑒了OpenAI的o3和其他前沿內(nèi)部模型。

gpt-oss模型使用預(yù)訓(xùn)練和后訓(xùn)練技術(shù)，注重推理能力、效率以及在各種部署環(huán)境中的實(shí)際可用性。每個(gè)模型都基于Transformer，利用混合專家（MoE）技術(shù)減少處理輸入所需的激活參數(shù)數(shù)量。gpt-oss-120b每token激活51億參數(shù)，gpt-oss-20b每token激活36億參數(shù)，兩款模型的總參數(shù)分別為1170億和210億。它們采用交替的密集型和局部帶狀稀疏注意力模式，類似于GPT-3。使用旋轉(zhuǎn)位置編碼（RoPE），支持長(zhǎng)達(dá)128k上下文長(zhǎng)度。兩款開源模型支持低、中、高三種推理強(qiáng)度，可在延遲和性能之間權(quán)衡，開發(fā)者只需在系統(tǒng)消息中用一句話就能設(shè)置推理強(qiáng)度。

OpenAI CEO山姆·奧特曼表示，gpt-oss的性能堪比o4-mini，而且能在高端筆記本上運(yùn)行，更小的版本能在手機(jī)上運(yùn)行。“不久的將來(lái)，會(huì)有一種比你認(rèn)識(shí)的最聰明的人還要智能的東西，在你口袋里的設(shè)備上運(yùn)行，隨時(shí)隨地幫你解決各種問(wèn)題。這真的是一件非同凡響的事。”

gpt-oss-120b與gpt-oss-20b在競(jìng)賽數(shù)學(xué)方面的性能。

gpt-oss-120b與gpt-oss-20b在競(jìng)賽編程方面的性能。

gpt-oss-120b模型在核心推理基準(zhǔn)測(cè)試上與OpenAI o4-mini幾乎持平，能在單張80GB GPU上高效運(yùn)行。在競(jìng)賽編程（Codeforces）、通用問(wèn)題解決（MMLU和HLE）以及工具調(diào)用（TauBench）方面，gpt-oss-120b的表現(xiàn)優(yōu)于OpenAI o3-mini，達(dá)到或超過(guò)了OpenAI o4-mini。在健康相關(guān)查詢和競(jìng)賽數(shù)學(xué)方面，它的表現(xiàn)甚至比o4-mini更好。gpt-oss-20b模型在常見基準(zhǔn)測(cè)試中的結(jié)果與OpenAI o3-mini相當(dāng)，甚至在競(jìng)賽數(shù)學(xué)和健康相關(guān)查詢方面的表現(xiàn)甚至超過(guò)了o3-mini，僅需16GB內(nèi)存即可在邊端設(shè)備上運(yùn)行。

OpenAI為何重新?lián)肀ч_源

三年前，OpenAI推出ChatGPT并引發(fā)人工智能熱潮，其后，OpenAI的技術(shù)大多處于保密狀態(tài)。其他公司則通過(guò)“開源”共享技術(shù)，搶占OpenAI的市場(chǎng)份額。尤其是DeepSeek的出現(xiàn)，在全球范圍內(nèi)掀起了新的開源浪潮。如今，OpenAI重新?lián)肀ч_源，希望借此平衡競(jìng)爭(zhēng)環(huán)境，確保企業(yè)和其他軟件開發(fā)者繼續(xù)使用其技術(shù)。OpenAI表示，發(fā)布開源系統(tǒng)的部分原因是，一些企業(yè)和個(gè)人更傾向于在自有計(jì)算機(jī)硬件上運(yùn)行這類技術(shù)。

“開源模型與我們的托管模型形成互補(bǔ)，為開發(fā)者提供了更豐富的工具選擇?！監(jiān)penAI表示，這有助于加速推進(jìn)前沿研究，迸發(fā)創(chuàng)新活力，在各類應(yīng)用場(chǎng)景中推動(dòng)更安全透明的AI開發(fā)。這些開源模型還降低了新興市場(chǎng)、資源受限行業(yè)及小型組織的使用門檻。

近期的研究表明，只要模型未接受過(guò)針對(duì)思維鏈對(duì)齊的直接監(jiān)督訓(xùn)練，監(jiān)控推理模型的思維鏈就有助于檢測(cè)不當(dāng)行為。OpenAI表示，兩款gpt-oss模型的思維鏈均未接受任何直接監(jiān)督，而這對(duì)于監(jiān)控模型的不當(dāng)行為、欺騙性輸出和濫用風(fēng)險(xiǎn)至關(guān)重要。發(fā)布兩款帶有非監(jiān)督式思維鏈的開源模型，能為開發(fā)者和研究人員提供機(jī)會(huì)，以便他們研究并構(gòu)建自己的思維鏈監(jiān)控系統(tǒng)。由于思維鏈可能包含幻覺信息或有害內(nèi)容，因此開發(fā)者不應(yīng)在其應(yīng)用中直接向用戶展示思維鏈內(nèi)容。

為了確保模型的安全性，在預(yù)訓(xùn)練階段，OpenAI過(guò)濾掉了與化學(xué)、生物、放射和核相關(guān)的特定有害數(shù)據(jù)，在后訓(xùn)練中運(yùn)用審慎對(duì)齊和指令層級(jí)技術(shù)，教會(huì)模型拒絕不安全的提示詞，并防御提示詞注入攻擊。開源模型發(fā)布后，攻擊者可能會(huì)出于惡意目的對(duì)模型進(jìn)行微調(diào)。為評(píng)估這類風(fēng)險(xiǎn)，OpenAI針對(duì)特定的生物學(xué)和網(wǎng)絡(luò)安全數(shù)據(jù)對(duì)模型進(jìn)行微調(diào)，模擬攻擊者的方式，為每個(gè)領(lǐng)域創(chuàng)建了一個(gè)特定領(lǐng)域的 “不拒絕”版本，并通過(guò)內(nèi)外部測(cè)試評(píng)估這些模型的能力水平。測(cè)試表明，即便使用OpenAI行業(yè)領(lǐng)先的訓(xùn)練堆棧進(jìn)行了微調(diào)，這些經(jīng)過(guò)惡意微調(diào)的模型仍無(wú)法達(dá)到高能力水平。

OpenAI表示，這些流程標(biāo)志著開源模型的安全性邁出了有意義的一步，“我們希望這些模型能幫助推動(dòng)整個(gè)行業(yè)的安全訓(xùn)練和對(duì)齊研究。”為構(gòu)建更安全的開源生態(tài)系統(tǒng)，OpenAI發(fā)起獎(jiǎng)金50萬(wàn)美元的“紅隊(duì)挑戰(zhàn)”，鼓勵(lì)來(lái)自世界各地的研究人員、開發(fā)人員和愛好者幫助識(shí)別新的安全問(wèn)題。

開源與閉源的辯論一直存在，企業(yè)的策略也在調(diào)整。與OpenAI擁抱開源不同，Meta或?qū)⑥D(zhuǎn)向更保守的閉源軟件策略。Meta新近成立超級(jí)智能實(shí)驗(yàn)室后，實(shí)驗(yàn)室一小批高級(jí)成員討論放棄該公司最強(qiáng)大的開源人工智能模型Behemoth，轉(zhuǎn)而開發(fā)閉源模型。

責(zé)任編輯：宦艷紅

校對(duì)：施鋆

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#OpenAI #開源