9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

GPT Images 2.0實測:文生圖模型能力斷層領(lǐng)先,細節(jié)處理仍有局限

澎湃新聞記者 秦盛
2026-04-23 07:57
來源:澎湃新聞
? 10%公司 >
聽全文
字號

4月22日,“庫克代言小米”“奧特曼帶貨豆包”等圖片刷屏社交平臺,引發(fā)網(wǎng)友高度關(guān)注。

當(dāng)天,OpenAI發(fā)布了其最新圖像生成模型ChatGPT Images 2.0。一經(jīng)發(fā)布,便迅速登上Image Arena所有排行榜榜首,在文生圖榜單上以242分的巨大優(yōu)勢登頂,創(chuàng)下該領(lǐng)域最大分差紀錄, 在文本渲染、肖像、卡通動漫等多個細分能力榜單上,也均位列第一。

Images 2.0新增的“思考模式”和對多語言文本的精準(zhǔn)渲染能力,被認為是此次最大的技術(shù)突破。OpenAI表示,該模型將圖像生成從單純的渲染提升到了戰(zhàn)略設(shè)計的高度,從一種工具轉(zhuǎn)變?yōu)橐粋€視覺系統(tǒng),幫助人們將想法轉(zhuǎn)化為可以理解、分享、用于教學(xué)并在此基礎(chǔ)上構(gòu)建的成果。

從“渲染”到“設(shè)計”究竟有多強

“思考”是Images 2.0最亮眼的新功能。據(jù)介紹,在生成圖像前,模型會先對任務(wù)進行拆解規(guī)劃,搜索網(wǎng)絡(luò)獲取實時信息、根據(jù)一個提示詞創(chuàng)建多個不同的圖像,并自我復(fù)核其輸出。

同時,長期以來AI圖像生成的最大痛點在于難以準(zhǔn)確渲染文字,尤其是中文、日文等非拉丁字母文字,Images 2.0在這方面也取得了巨大突破。

澎湃新聞記者嘗試讓它“生成一張馬斯克直播推介澎湃新聞的圖片”。模型不僅準(zhǔn)確生成了澎湃新聞的Logo和中文名,還自主整合了媒體的“專業(yè)、深度、原創(chuàng)”定位信息,其中的網(wǎng)友評論也結(jié)合了馬斯克的相應(yīng)風(fēng)格,生成了一張逼真的直播間截圖。

本文所有圖片均為記者使用Images 2.0生成

記者又讓其“換成巴菲特推薦澎湃財經(jīng)頻道”,模型再次準(zhǔn)確生成了一張直播間截圖,并精準(zhǔn)還原了澎湃新聞手機端App的UI界面。

在進一步的實測中,記者又要求其生成“一張寫實照片,一位年輕記者在珠峰進行新聞報道,舉著印有澎湃新聞的旗幟”。Images 2.0生成的畫面還原了珠峰大本營標(biāo)志性的雪山背景、碎石地貌與高海拔環(huán)境,旗幟上“澎湃新聞”的中英文標(biāo)識清晰,字體排版與實際品牌視覺系統(tǒng)一致,背景中也包含了登山帳篷與海拔標(biāo)識牌,進一步增強了真實感。

記者又要求模型生成一張澎湃新聞《新引擎》周刊封面,主題為“20年后的上?!保皷|方明珠”、“黃浦江”等中文字樣。Images 2一次性成功生成了排版清晰、文字準(zhǔn)確的封面圖,無論是大標(biāo)題還是小字注釋,都沒有出現(xiàn)以往模型常見的筆畫扭曲或亂碼問題。

不僅如此,生成的圖像和海報還支持一鍵修改尺寸。

在記者要求其生成一張澎湃新聞《超級投資人》節(jié)目對話羅杰斯的分鏡圖時,Images 2.0不僅精準(zhǔn)捕捉了羅杰斯的外貌特征,而且在生成的分鏡中保持了極高的一致性。無論是人物神態(tài)、衣著細節(jié),還是場景的光影邏輯,均未出現(xiàn)以往AI生圖中常見的“換臉”或“變形”現(xiàn)象。

記者又要求Images 2.0“生成一幅人形機器人半馬的四格漫畫”,生成的圖像也保持了一致性,并補充了比賽地點、途中故事、完賽時間等細節(jié)。

不僅如此,對于記者“生成一張超級馬里奧的游戲畫面,關(guān)卡是挑戰(zhàn)滅霸”的指令,Images 2.0也精準(zhǔn)生成出了相應(yīng)游戲界面。

人人都是設(shè)計師?局限依然存在

在上述實測中,記者并未精心打磨提示詞,絕大部分情況下僅僅是一句話指令,較高質(zhì)量的視覺內(nèi)容便可以創(chuàng)作出來,生成時間在十幾秒到數(shù)分鐘不等。ChatGPT Images 2.0已經(jīng)展現(xiàn)出了足夠巨大的潛力,或?qū)?nèi)容創(chuàng)作和設(shè)計行業(yè)產(chǎn)生巨大影響。

不過,盡管表現(xiàn)卓越,Images 2.0也并非完美無缺。OpenAI也坦言了其當(dāng)前在物理模擬、復(fù)雜細節(jié)處理和邏輯上可能仍存在局限性。

仔細觀察可以發(fā)現(xiàn),以上記者測試生成的圖像中還是有不少問題,比如,在馬斯克手中的澎湃新聞App文章標(biāo)題小字顯示錯亂,澎湃新聞也并未推出年度會員產(chǎn)品;在測試生成的周刊封面圖中,大樓樓體出現(xiàn)了歪曲的情況,新聞發(fā)布日期也顯示為“2024年”,與“20年后”的設(shè)定不符。

同時,由于Images 2.0的知識截止日期為2025年12月,并不能很好處理進步迅速的人形機器人等前沿領(lǐng)域的任務(wù)要求,在記者測試中生成的漫畫內(nèi)容雖然并沒有錯誤,但使用的是2025年首屆人形機器人半馬的賽事相關(guān)信息。

更需要注意的一點是,從記者測試生成的馬斯克和巴菲特直播截圖可以發(fā)現(xiàn),AI生成內(nèi)容視覺風(fēng)格同質(zhì)化問題仍會存在,如何保持創(chuàng)意的獨特性也將是未來創(chuàng)作者面臨的新課題。

最后,也是最為實際的一個問題,目前ChatGPT Images 2.0雖然向所有ChatGPT和Codex用戶開放,但免費用戶有使用限制,記者實測一天內(nèi)可生成約5次圖片,帶有思維鏈功能的高級輸出僅供Plus、Pro和Business用戶使用。

    責(zé)任編輯:鄭景昕
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司

            当阳市| 巴南区| 兴仁县| 辰溪县| 泰来县| 武鸣县| 富蕴县| 宁波市| 保山市| 岫岩| 淳安县| 芜湖市| 淮阳县| 蓬安县| 库车县| 霸州市| 准格尔旗| 红安县| 新丰县| 独山县| 五家渠市| 高雄市| 博客| 满城县| 洪雅县| 东海县| 长治市| 呼图壁县| 兴文县| 荣成市| 通城县| 政和县| 涿鹿县| 门头沟区| 青铜峡市| 斗六市| 墨脱县| 华坪县| 修武县| 吉林市| 施甸县|