- +1
產(chǎn)生“自我認(rèn)知”的Claude 3現(xiàn)已登陸Amazon Bedrock
Claude 3最近正在被網(wǎng)友瘋狂測(cè)試。一位量子物理學(xué)博士,認(rèn)為Claude 3是唯一理解他博士畢業(yè)論文的人之一,沒(méi)錯(cuò)就是“人”。
還有就是在經(jīng)典的“大海撈針”測(cè)試中,Claude 3不僅找到了那句格格不入的話,而且它還懷疑這個(gè)披薩配料“事實(shí)”可能是作為一個(gè)笑話插入的,或者是為了測(cè)試它是否在注意,因?yàn)樗静环掀渌掝}。
一時(shí)間,很多人都在驚呼Claude 3產(chǎn)生了“自我認(rèn)知”。當(dāng)然英偉達(dá)科學(xué)家Jim Fan也認(rèn)為不必過(guò)度解讀,Claude 3看似有自我意識(shí)的表現(xiàn)只是對(duì)齊了人類數(shù)據(jù)。Claude 3的發(fā)布受到了熱捧,就像OpenAI背后的微軟一樣,也讓亞馬遜云科技這個(gè)幕后玩家成為最大受益者。
三種“杯形”任你選擇
Anthropic的核心成員都是來(lái)自O(shè)penAI,所以Claude 3也是無(wú)時(shí)無(wú)刻不在對(duì)標(biāo)GPT-4,距離上一代的Claude 2發(fā)布,僅相隔8個(gè)月。
Claude 3系列模型主要包括Haiku(中杯)、Sonnet(大杯)與Opus(超大杯)。在推理、數(shù)學(xué)、編碼、多語(yǔ)言和視覺(jué)等多個(gè)領(lǐng)域的20款測(cè)試中,Claude 3 Opus在14個(gè)性能指標(biāo)下超越了GPT-4、谷歌Gemini等一系列模型。
三個(gè)模型均提供200k長(zhǎng)度的上下文,并針對(duì)不同的用例進(jìn)行了優(yōu)化。三個(gè)模型有著不同的適用場(chǎng)景。Haiku的優(yōu)勢(shì)在于速度和成本效益,這是一種快速緊湊的模型,具有近乎即時(shí)的響應(yīng)能力。
Sonnet在智能和速度之間實(shí)現(xiàn)了理想的平衡,適用于絕大多數(shù)工作負(fù)載,速度比Claude 2 和Claude 2.1快2倍,且智能水平更高。它擅長(zhǎng)執(zhí)行需要快速響應(yīng)的智能任務(wù),例如知識(shí)檢索或銷售自動(dòng)化。
Opus是最先進(jìn)、最強(qiáng)大的大模型,具有深度推理、高級(jí)數(shù)學(xué)和編碼能力,在高度復(fù)雜的任務(wù)上具有頂級(jí)性能。它可以非常流暢地導(dǎo)航開放式提示和新穎場(chǎng)景,包括任務(wù)自動(dòng)化、假設(shè)生成以及圖表、圖形和預(yù)測(cè)的分析。
Claude 3具備三大優(yōu)勢(shì):一流的基準(zhǔn)性能、視覺(jué)功能以及更加安全。
一流的基準(zhǔn)性能:Claude 3在數(shù)學(xué)問(wèn)題、編程練習(xí)和科學(xué)推理,超越了現(xiàn)有模型。Opus在大多數(shù)常見(jiàn)的評(píng)測(cè)基準(zhǔn)中都優(yōu)于同行,本科水平專家知識(shí)(MMLU)、研究生水平專家推理(GPQA)、基礎(chǔ)數(shù)學(xué)(GSM8K),官方也給出了根據(jù)上下文數(shù)據(jù)審計(jì)財(cái)務(wù)報(bào)告的例子。
視覺(jué)功能:Claude 3模型經(jīng)過(guò)訓(xùn)練,可以理解各類數(shù)據(jù),包括語(yǔ)言、圖像、圖表等。企業(yè)能夠基于多源媒體,構(gòu)建真正跨領(lǐng)域的生成式人工智能應(yīng)用。像查詢藥物研究論文、蛋白質(zhì)結(jié)構(gòu)分析,媒體組織可以自動(dòng)生成圖像標(biāo)題或視頻腳本。
減輕幻覺(jué):Claude 3模型通過(guò)憲法AI技術(shù)減輕幻覺(jué)現(xiàn)象,這些技術(shù)提供了對(duì)模型推理過(guò)程的透明度,并且提高了準(zhǔn)確性。Claude 3 Opus在困難的開放式問(wèn)題上,減少了錯(cuò)誤回答的可能性??煽氐闹笇?dǎo)自動(dòng)化流程,在制造、醫(yī)療、金融和法律等行業(yè)至關(guān)重要。
至頂網(wǎng)也從故事、數(shù)學(xué)、識(shí)圖三個(gè)層面進(jìn)行了測(cè)試,其中較為突出的是數(shù)學(xué)和識(shí)圖能力,而且Claude 3的生成速度也更快,不會(huì)產(chǎn)生中斷。官方也公布了三段演示視頻,通過(guò)圖像識(shí)別預(yù)測(cè)美國(guó)GDP在未來(lái)十年的可能走向,以及全球各主要經(jīng)濟(jì)體的趨勢(shì);在不到三秒的時(shí)間內(nèi)完成對(duì)約10k token的arXiv論文的閱讀;用西班牙語(yǔ)進(jìn)行交談,用英語(yǔ)寫出這些內(nèi)容,并用西班牙語(yǔ)回復(fù)。
靜待合作開花結(jié)果
亞馬遜云科技在去年9月就宣布向Anthropic投資40億美元,加速Anthropic未來(lái)基礎(chǔ)模型的開發(fā),并將其廣泛提供給亞馬遜云科技的客戶使用。Anthropic使用Amazon Trainium和Amazon Inferentia芯片來(lái)構(gòu)建、訓(xùn)練和部署其未來(lái)基礎(chǔ)模型,并充分利用亞馬遜云科技在價(jià)格、性能、規(guī)模和安全方面的優(yōu)勢(shì)。
去年4月Amazon Bedrock就已經(jīng)開始提供Claude模型給亞馬遜云科技的客戶。Amazon Bedrock是一項(xiàng)完全托管的服務(wù),可提供多種高性能基礎(chǔ)模型(FM),以及構(gòu)建生成式人工智能應(yīng)用程序所需的一系列廣泛功能。
Amazon Bedrock也成為率先提供Claude 3 Sonnet的托管服務(wù)商,下一代Claude 3另外兩個(gè)模型 Claude 3 Opus和 Claude 3 Haiku也將很快在Amazon Bedrock推出。
在大模型的應(yīng)用中,多種模型的組合使用是非常常見(jiàn)的,Amazon Bedrock則已經(jīng)幫助客戶優(yōu)選了模型,讓其可以在一個(gè)平臺(tái)同時(shí)使用多種模型。Amazon Bedrock在近日將大模型提供商擴(kuò)充至7家。至此,Amazon Bedrock的大模型供應(yīng)商共有AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI,Mistral AI的兩種高性能模型Mistral 7B 和 Mixtral 8x7B也已經(jīng)在Amazon Bedrock正式可用。
最近亞馬遜云科技數(shù)據(jù)和AI副總裁Swami Sivasubramanian博士在博客文章中寫到:“回顧2021年,當(dāng)Anthropic第一次開始在亞馬遜云科技上構(gòu)建時(shí),沒(méi)有人能想到Claude系列模型會(huì)帶來(lái)多大的變革?!?/p>
亞馬遜云科技全球產(chǎn)品副總裁Matt Wood博士表示,在智能程度上,Claude 3 Opus是世界上最先進(jìn)、最強(qiáng)大、最先進(jìn)的基礎(chǔ)模型,具有深度推理、高級(jí)數(shù)學(xué)和編碼能力,在高度復(fù)雜的任務(wù)上具有頂級(jí)性能。Claude 3 Sonnet在智能和速度之間取得了理想的平衡,特別適合企業(yè)用例。Claude 3 Haiku是一款快速緊湊的模型,具有近乎即時(shí)的響應(yīng)能力。所有Claude 3型號(hào)現(xiàn)在都包含最先進(jìn)的視覺(jué)功能,可以通過(guò)OCR處理和分析圖像、照片、圖表、圖表、技術(shù)圖表和文本。因此,Claude 3模型可以從文檔、Web 用戶界面等中提取更多信息。
未來(lái)“云+大模型”將成為主要的發(fā)展路徑,同OpenAI的AGI選擇不同,Claude 3還是希望走2B路線,在商業(yè)場(chǎng)景中實(shí)現(xiàn)價(jià)值,這也和亞馬遜云科技服務(wù)的客戶相吻合,兩者組合在一起,也會(huì)變相加速大模型應(yīng)用的快速落地。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




