- +1
OpenAI正與數(shù)十家出版商洽談內(nèi)容許可,年費用低至100萬美元
·OpenAI表示,正在與數(shù)十家出版商洽談達(dá)成文章授權(quán)協(xié)議。消息人士稱,OpenAI每年向一些媒體公司提供100萬至500萬美元的費用以獲得受版權(quán)保護的新聞文章,訓(xùn)練其大語言模型。
1月5日,美國人工智能公司OpenAI表示,正在與數(shù)十家出版商洽談達(dá)成文章授權(quán)協(xié)議,以獲取內(nèi)容來訓(xùn)練其人工智能模型。
“我們正在與許多出版商進行多次談判和討論。他們很活躍,非常積極,目前進展順利?!監(jiān)penAI知識產(chǎn)權(quán)和內(nèi)容主管湯姆·羅賓(Tom Rubin)在接受彭博社采訪時表示,“你看到了已經(jīng)宣布的交易,未來還會有更多?!?/p>
OpenAI最近與新聞出版巨頭施普林格出版集團 (Axel Springer) 簽署了一項多年期許可協(xié)議,這是該公司與此類出版商的首次合作。施普林格是一家總部位于德國的跨國大眾媒體公司,旗下?lián)碛蠦usiness Insider和Politico等品牌。該交易的財務(wù)條款從未公開,但據(jù)The Information援引OpenAI兩位高管的消息稱,交易金額在數(shù)千萬美元左右。
7月,OpenAI宣布與美聯(lián)社達(dá)成一項類似協(xié)議,金額未公開。這些交易對于OpenAI的未來至關(guān)重要,因為它正在平衡構(gòu)建模型所需數(shù)據(jù)的需求與對數(shù)據(jù)來源??日益嚴(yán)格的審查。
實際上,這些交易似乎與前幾年類似。谷歌在2020年宣布將總共投資10億美元與新聞機構(gòu)合作。在新法律的壓力下,谷歌最近還同意每年向加拿大出版商支付總計1億美元,以換取其文章鏈接。
隨著新聞出版商與人工智能公司簽訂協(xié)議,用新聞文章訓(xùn)練其模型,OpenAI等企業(yè)愿意為受版權(quán)保護信息支付的價格逐漸浮出水面。The Information援引匿名消息人士稱,OpenAI每年向一些媒體公司提供100萬至500萬美元的費用,以使用其新聞文章用于訓(xùn)練大型語言模型。即使對于小型出版商來說,這個數(shù)額也很小,這可能會讓OpenAI難以達(dá)成交易。
與此同時,蘋果公司也正在參與開發(fā)生成式人工智能的競賽,并與擁有《Vogue》和《紐約客》的康迪納仕(Condnast)、擁有Daily Beast的NBC新聞和IAC等出版商簽訂了價值約5000萬美元的協(xié)議。
這些行動背后的邏輯都在于,當(dāng)今大型語言模型訓(xùn)練的大量數(shù)據(jù)資源來自于互聯(lián)網(wǎng)。然而就訓(xùn)練生成式人工智能而言,似乎已經(jīng)難有更多的免費午餐。
一方面,《紐約時報》、CNN、路透社和The Verge的母公司Vox Media最近阻止了OpenAI的GPT爬蟲訪問數(shù)據(jù)。另一方面,一些組織認(rèn)為基于其數(shù)據(jù)進行訓(xùn)練構(gòu)成版權(quán)侵權(quán)。
最近,《紐約時報》在美國聯(lián)邦法院起訴OpenAI和微軟,指控這兩家科技公司非法使用“數(shù)百萬篇”受《紐約時報》版權(quán)保護的文章,幫助開發(fā)ChatGPT和必應(yīng)等工具背后的人工智能模型。這是一系列訴訟中最新的一起,也是關(guān)注度最高的一起,這些訴訟指控各種科技和人工智能公司侵犯了媒體公司、攝影網(wǎng)站、圖書作者和藝術(shù)家的知識產(chǎn)權(quán)。
一些法律專家表示,這些案件加在一起,有可能動搖蓬勃發(fā)展的生成式人工智能行業(yè)的基礎(chǔ),但它們也可能落空。這是因為科技公司可能會嚴(yán)重依賴一個過去對它們很有幫助的法律概念:“合理使用”原則。
從廣義上講,版權(quán)法區(qū)分了逐字抄襲別人的作品和“重新混合”或?qū)⑵溆糜谛碌摹?chuàng)造性的用途,前者通常屬于非法??的螤柎髮W(xué)數(shù)字和信息法教授詹姆斯·格里梅爾曼(James Grimmelmann)在接受《華盛頓郵報》采訪時表示,人工智能系統(tǒng)令人困惑的是,在這種情況下,它們似乎兩者都在做。
OpenAI和微軟已經(jīng)在進行類似的辯護。去年11月,OpenAI在提交給美國版權(quán)局的一份文件中寫道:“我們認(rèn)為,人工智能模型的訓(xùn)練符合合理使用的條件,完全符合現(xiàn)有的先例,即技術(shù)創(chuàng)新者以變革性方式使用受版權(quán)保護的材料,這完全符合版權(quán)法?!?/p>
格里梅爾曼則表示,生成式人工智能代表了“這一重大的技術(shù)變革,它可以制作任何東西的混合版本”?!疤魬?zhàn)在于,這些模型還可以明目張膽地記住它們訓(xùn)練過的作品,并經(jīng)常復(fù)制出幾乎一模一樣的作品?!彼f,這是“傳統(tǒng)上版權(quán)法禁止的核心內(nèi)容”。
《紐約時報》表示:“在不付費的情況下使用其內(nèi)容進行創(chuàng)造以替代《紐約時報》并搶走觀眾的產(chǎn)品,并沒有什么‘變革性’?!逼淇偡深檰桏彀病げ祭最D(Diane Brayton)在一份內(nèi)部備忘錄中告訴員工,該報認(rèn)識到生成式人工智能在新聞業(yè)的潛力,但“使用我們的工作來創(chuàng)建生成式人工智能工具必須獲得許可和反映該工作公平價值的協(xié)議,正如法律規(guī)定的那樣?!?/p>





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




