9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

GPT Images 2.0實(shí)測(cè):文生圖模型能力斷層領(lǐng)先,細(xì)節(jié)處理仍有局限

澎湃新聞?dòng)浾?秦盛
2026-04-23 07:57
來(lái)源:澎湃新聞
? 10%公司 >
聽(tīng)全文
字號(hào)

4月22日,“庫(kù)克代言小米”“奧特曼帶貨豆包”等圖片刷屏社交平臺(tái),引發(fā)網(wǎng)友高度關(guān)注。

當(dāng)天,OpenAI發(fā)布了其最新圖像生成模型ChatGPT Images 2.0。一經(jīng)發(fā)布,便迅速登上Image Arena所有排行榜榜首,在文生圖榜單上以242分的巨大優(yōu)勢(shì)登頂,創(chuàng)下該領(lǐng)域最大分差紀(jì)錄, 在文本渲染、肖像、卡通動(dòng)漫等多個(gè)細(xì)分能力榜單上,也均位列第一。

Images 2.0新增的“思考模式”和對(duì)多語(yǔ)言文本的精準(zhǔn)渲染能力,被認(rèn)為是此次最大的技術(shù)突破。OpenAI表示,該模型將圖像生成從單純的渲染提升到了戰(zhàn)略設(shè)計(jì)的高度,從一種工具轉(zhuǎn)變?yōu)橐粋€(gè)視覺(jué)系統(tǒng),幫助人們將想法轉(zhuǎn)化為可以理解、分享、用于教學(xué)并在此基礎(chǔ)上構(gòu)建的成果。

從“渲染”到“設(shè)計(jì)”究竟有多強(qiáng)

“思考”是Images 2.0最亮眼的新功能。據(jù)介紹,在生成圖像前,模型會(huì)先對(duì)任務(wù)進(jìn)行拆解規(guī)劃,搜索網(wǎng)絡(luò)獲取實(shí)時(shí)信息、根據(jù)一個(gè)提示詞創(chuàng)建多個(gè)不同的圖像,并自我復(fù)核其輸出。

同時(shí),長(zhǎng)期以來(lái)AI圖像生成的最大痛點(diǎn)在于難以準(zhǔn)確渲染文字,尤其是中文、日文等非拉丁字母文字,Images 2.0在這方面也取得了巨大突破。

澎湃新聞?dòng)浾邍L試讓它“生成一張馬斯克直播推介澎湃新聞的圖片”。模型不僅準(zhǔn)確生成了澎湃新聞的Logo和中文名,還自主整合了媒體的“專業(yè)、深度、原創(chuàng)”定位信息,其中的網(wǎng)友評(píng)論也結(jié)合了馬斯克的相應(yīng)風(fēng)格,生成了一張逼真的直播間截圖。

本文所有圖片均為記者使用Images 2.0生成

記者又讓其“換成巴菲特推薦澎湃財(cái)經(jīng)頻道”,模型再次準(zhǔn)確生成了一張直播間截圖,并精準(zhǔn)還原了澎湃新聞手機(jī)端App的UI界面。

在進(jìn)一步的實(shí)測(cè)中,記者又要求其生成“一張寫實(shí)照片,一位年輕記者在珠峰進(jìn)行新聞報(bào)道,舉著印有澎湃新聞的旗幟”。Images 2.0生成的畫面還原了珠峰大本營(yíng)標(biāo)志性的雪山背景、碎石地貌與高海拔環(huán)境,旗幟上“澎湃新聞”的中英文標(biāo)識(shí)清晰,字體排版與實(shí)際品牌視覺(jué)系統(tǒng)一致,背景中也包含了登山帳篷與海拔標(biāo)識(shí)牌,進(jìn)一步增強(qiáng)了真實(shí)感。

記者又要求模型生成一張澎湃新聞《新引擎》周刊封面,主題為“20年后的上海”,并包含“東方明珠”、“黃浦江”等中文字樣。Images 2一次性成功生成了排版清晰、文字準(zhǔn)確的封面圖,無(wú)論是大標(biāo)題還是小字注釋,都沒(méi)有出現(xiàn)以往模型常見(jiàn)的筆畫扭曲或亂碼問(wèn)題。

不僅如此,生成的圖像和海報(bào)還支持一鍵修改尺寸。

在記者要求其生成一張澎湃新聞《超級(jí)投資人》節(jié)目對(duì)話羅杰斯的分鏡圖時(shí),Images 2.0不僅精準(zhǔn)捕捉了羅杰斯的外貌特征,而且在生成的分鏡中保持了極高的一致性。無(wú)論是人物神態(tài)、衣著細(xì)節(jié),還是場(chǎng)景的光影邏輯,均未出現(xiàn)以往AI生圖中常見(jiàn)的“換臉”或“變形”現(xiàn)象。

記者又要求Images 2.0“生成一幅人形機(jī)器人半馬的四格漫畫”,生成的圖像也保持了一致性,并補(bǔ)充了比賽地點(diǎn)、途中故事、完賽時(shí)間等細(xì)節(jié)。

不僅如此,對(duì)于記者“生成一張超級(jí)馬里奧的游戲畫面,關(guān)卡是挑戰(zhàn)滅霸”的指令,Images 2.0也精準(zhǔn)生成出了相應(yīng)游戲界面。

人人都是設(shè)計(jì)師?局限依然存在

在上述實(shí)測(cè)中,記者并未精心打磨提示詞,絕大部分情況下僅僅是一句話指令,較高質(zhì)量的視覺(jué)內(nèi)容便可以創(chuàng)作出來(lái),生成時(shí)間在十幾秒到數(shù)分鐘不等。ChatGPT Images 2.0已經(jīng)展現(xiàn)出了足夠巨大的潛力,或?qū)?duì)內(nèi)容創(chuàng)作和設(shè)計(jì)行業(yè)產(chǎn)生巨大影響。

不過(guò),盡管表現(xiàn)卓越,Images 2.0也并非完美無(wú)缺。OpenAI也坦言了其當(dāng)前在物理模擬、復(fù)雜細(xì)節(jié)處理和邏輯上可能仍存在局限性。

仔細(xì)觀察可以發(fā)現(xiàn),以上記者測(cè)試生成的圖像中還是有不少問(wèn)題,比如,在馬斯克手中的澎湃新聞App文章標(biāo)題小字顯示錯(cuò)亂,澎湃新聞也并未推出年度會(huì)員產(chǎn)品;在測(cè)試生成的周刊封面圖中,大樓樓體出現(xiàn)了歪曲的情況,新聞發(fā)布日期也顯示為“2024年”,與“20年后”的設(shè)定不符。

同時(shí),由于Images 2.0的知識(shí)截止日期為2025年12月,并不能很好處理進(jìn)步迅速的人形機(jī)器人等前沿領(lǐng)域的任務(wù)要求,在記者測(cè)試中生成的漫畫內(nèi)容雖然并沒(méi)有錯(cuò)誤,但使用的是2025年首屆人形機(jī)器人半馬的賽事相關(guān)信息。

更需要注意的一點(diǎn)是,從記者測(cè)試生成的馬斯克和巴菲特直播截圖可以發(fā)現(xiàn),AI生成內(nèi)容視覺(jué)風(fēng)格同質(zhì)化問(wèn)題仍會(huì)存在,如何保持創(chuàng)意的獨(dú)特性也將是未來(lái)創(chuàng)作者面臨的新課題。

最后,也是最為實(shí)際的一個(gè)問(wèn)題,目前ChatGPT Images 2.0雖然向所有ChatGPT和Codex用戶開(kāi)放,但免費(fèi)用戶有使用限制,記者實(shí)測(cè)一天內(nèi)可生成約5次圖片,帶有思維鏈功能的高級(jí)輸出僅供Plus、Pro和Business用戶使用。

    責(zé)任編輯:鄭景昕
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司

            伊川县| 淮滨县| 乌兰察布市| 凤城市| 石台县| 绥化市| 通城县| 龙南县| 龙泉市| 郎溪县| 北票市| 潞城市| 万荣县| 尖扎县| 万山特区| 紫阳县| 巧家县| 竹山县| 三门县| 迁西县| 望谟县| 孟津县| 丰镇市| 大理市| 吉水县| 松桃| 宣汉县| 扬中市| 曲水县| 平潭县| 宜川县| 舟山市| 彝良县| 抚松县| 新龙县| 诏安县| 高尔夫| 海阳市| 镇巴县| 壶关县| 邹平县|