- +1
全面押注智能體!谷歌Gemini 3.5登場,首款個人智能體亮相
谷歌展現(xiàn)出全面押注AI Agent(智能體)的野心。
當(dāng)?shù)貢r間5月19日,一年一度的2026年谷歌I/O開發(fā)者大會正式開始。在這場年度大會上,谷歌宣布了一系列圍繞Agentic AI(代理式人工智能)的更新,推出下一代大模型Gemini 3.5 Flash。
谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)在會上表示,谷歌各平臺目前每月處理3.2千萬億個token(詞元),同比增長七倍。過去一年,谷歌旗下Gemini App增長迅速:在去年5月舉辦上一屆I/O大會時,Gemini有4億用戶;今年,其月活用戶數(shù)已經(jīng)超過9億,覆蓋230個國家和地區(qū)、70多種語言。
皮查伊表示:“大模型Gemini 3.5和Antigravity(谷歌智能體開發(fā)平臺)正在開啟一個智能體和智能體能力的新世界。此前,我們已經(jīng)把智能體帶給開發(fā)者和企業(yè)。現(xiàn)在,我們非常專注于把智能體的力量,以安全、可靠的方式帶給消費者,讓它適用于每一個人?!?/p>
谷歌DeepMind CEO德米斯?哈薩比斯(Demos Hassabis)更是在演講中直言:“我認(rèn)為,當(dāng)回看這段時光,我們將會發(fā)現(xiàn),我們正站在技術(shù)奇點(Singularity)的前一步?!?/p>
Gemini 3.5 Flash強調(diào)性價比,輸出速度比競爭對手快4倍
在會上,谷歌發(fā)布了Gemini 3.5模型家族的首個成員Gemini 3.5 Flash。谷歌將其定義為“結(jié)合前沿智能與行動能力”的新一代模型,主打兩大關(guān)鍵詞:智能體能力和速度。
據(jù)介紹,Gemini 3.5 Flash 是其目前最強的智能體和代碼模型,在復(fù)雜長周期任務(wù)、代碼生成、多模態(tài)理解等方面均有顯著提升。
谷歌特別強調(diào)該模型的性價比,稱其在輸出速度上比其他前沿模型快4倍。據(jù)谷歌測算,一家每天處理約1萬億Token的頭部科技企業(yè),如果其將80%的日常負(fù)載從其他前沿模型遷移至Gemini 3.5 Flash,每年可節(jié)省超過10億美元。

Gemini 3.5 Flash(右)和Gemini 3.1 Pro(左)的部分成績對比
同時,性能更強的Gemini 3.5 Pro已在谷歌內(nèi)部被使用,計劃于下個月推出。
在多模態(tài)模型方面,谷歌推出Gemini Omni Flash。該模型被公司定義為:可以從任何輸入生成任何輸出的模型,首先從視頻開始。這意味著,用戶可以用文本、圖片、音頻、視頻作為輸入,生成高質(zhì)量視頻。未來,其還會支持圖像和音頻等更多輸出形式。
谷歌特別提到了Gemini Omni Flash的數(shù)字化身(Avatar)功能。用戶可以使用自己的聲音創(chuàng)建個人數(shù)字化身,讓生成視頻看起來和聽起來像自己。不過,公司仍測試在視頻編輯中修改音頻和語音的能力,以更謹(jǐn)慎地處理潛在風(fēng)險。在內(nèi)容安全方面,Omni生成的視頻將包含不可感知的SynthID數(shù)字水印。
Gemini Omni Flash將會向谷歌AI Plus、Pro和Ultra的全球訂閱用戶開放,也會從本周起在YouTube Shorts和YouTube Create App中向用戶免費開放。未來數(shù)周內(nèi),谷歌還將把它通過API提供給開發(fā)者和企業(yè)客戶。
推出個人智能體Gemini Spark
此外,Gemini App也在本次大會上迎來大更新,在應(yīng)用設(shè)計、回答方式上進(jìn)行了升級,并推出兩個智能體功能:Daily Brief 和 Gemini Spark。
其中,Daily Brief被稱為個性化晨間簡報智能體,可以幫助用戶整理每天開始前需要知道的信息。Gemini Spark則是谷歌面向消費者推出的首款個人AI智能體,它可以無間斷地運行,在用戶授權(quán)和指令下幫助管理任務(wù)、處理數(shù)字生活,該產(chǎn)品可以全面接入谷歌旗下應(yīng)用。
谷歌計劃先向部分測試者推出Gemini Spark,并在下周面向美國谷歌AI Ultra 用戶推出其Beta測試版。macOS版 Gemini App也會在未來集成Gemini Spark,可以在本地機器上執(zhí)行操作。
當(dāng)然,谷歌沒有忘記自己的“老本行”谷歌搜索。據(jù)介紹,更新后的搜索框?qū)⒛軌騽討B(tài)擴展,允許用戶輸入更復(fù)雜、更自然的問題。它可以給出AI驅(qū)動的問題建議,不再只是傳統(tǒng)自動完成,并支持多模態(tài)輸入,包括文本、圖片、文件、視頻和Chrome標(biāo)簽頁。
同時,谷歌搜索的AI Mode將使用 Gemini 3.5 Flash作為全球默認(rèn)模型。用戶可以從AI Overview(AI概覽)直接繼續(xù)追問,并保留上下文。谷歌還推出了新的Search智能體,這類智能體可以在后臺保持運行,持續(xù)跟蹤用戶關(guān)心的信息,并在合適時間給出綜合更新。
此外,谷歌還在電商領(lǐng)域加碼,宣布推出智能虛擬購物車Universal Cart,以作為用戶通過谷歌進(jìn)行AI購物的核心,將在今年夏天開放。
而在安卓操作系統(tǒng)領(lǐng)域,谷歌本次推出的更新較少。谷歌將在今年晚些時候上線的 Android Halo,用來在手機屏幕頂部顯示智能體正在處理的任務(wù)。
19日當(dāng)天,谷歌(Nasdaq:GOOGL)股價跌2.34%收于每股387.66美元,總市值4.70萬億美元。今年以來,公司股價漲近24%。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




