- +1
自變量:35天后機器人入駐真實家庭,復雜且隨機性數(shù)據(jù)“必須采集”
機器人正式進入家庭提上日程。
4月21日,自變量機器人舉行發(fā)布會,推出新一代機器人進家庭計劃,宣布35天后,機器人將搭載新一代自研具身智能基礎模型WALL-B入駐真實家庭。
自變量創(chuàng)始人兼CEO王潛在發(fā)布會上表示,當前機器人的核心瓶頸不在本體,而在智能。家庭環(huán)境中的每一秒都可能出現(xiàn)全新事件:貓何時跳上桌子、孩子把玩具扔在哪里、地毯的摩擦力與實驗室地板完全不同?,F(xiàn)有技術(shù)無法處理這種隨機性和碎片化,機器人進入家庭也被視為“這個時代最難的技術(shù)問題之一”。

自變量創(chuàng)始人兼CEO王潛在發(fā)布會上
解決數(shù)據(jù)損耗:世界模型并非外掛模塊
據(jù)自變量聯(lián)合創(chuàng)始人兼CTO王昊介紹,WALL-B定位為基于世界統(tǒng)一模型架構(gòu)(WUM,World Unified Model) 的具身智能基礎模型,設計思路類似于Apple Silicon的統(tǒng)一內(nèi)存架構(gòu),在蘋果M1芯片之前的Mac上,CPU、GPU、內(nèi)存各自獨立,數(shù)據(jù)搬運產(chǎn)生的延遲和損耗成為性能瓶頸,蘋果通過統(tǒng)一內(nèi)存架構(gòu)讓所有處理單元共享同一塊內(nèi)存,性能由此大幅提升。
在機器人領域,VLA(視覺-語言-動作模型)就類似于M1之前的筆記本電腦架構(gòu),視覺模塊、語言模塊、動作模塊各自為政,數(shù)據(jù)在模塊之間搬來搬去,每搬一次就丟一次信息。WALL-B將視覺、語言、動作、物理預測等所有能力,放在同一個網(wǎng)絡中從零開始聯(lián)合訓練、融為一體,消除了模塊間的邊界和數(shù)據(jù)搬運損耗。
王昊強調(diào),世界模型并非一個單獨的外掛模塊,而是一種對物理世界未來的預測能力?!耙鉀Q數(shù)據(jù)損耗問題,不能簡單累加模塊,而是要補上預測能力?!?/p>
“糖水”與“牛奶”:看似最難的路反而可能最簡單
“這個行業(yè)最大的秘密,不是算法,不是架構(gòu),不是硬件,數(shù)據(jù)才是?!蓖蹶粚碓从趯嶒炇业母蓛?、穩(wěn)定、可預測的數(shù)據(jù)比作“糖水數(shù)據(jù)”,用此類數(shù)據(jù)訓練的模型,就像在泳池里學了10年游泳的人,一旦被丟進大海就會淹死?!八芴?,但除了甜并不會增加抵抗力,也不會提升體質(zhì)。喝多了有可能還會增加患糖尿病的風險”,訓練出的模型幾乎不具備零樣本泛化能力。
與之相對,源自真實家庭、復雜不可控且充滿隨機性的數(shù)據(jù)則是具身智能的“牛奶數(shù)據(jù)”。盡管采集過程“很苦、很慢、很貴”,但王昊認為,要想要做出真正具備零樣本泛化能力的基礎模型,這條看似最難的路反而可能是最簡單的。為此,自變量團隊進入了超過100個志愿者的家庭去訓練模型。

自變量聯(lián)合創(chuàng)始人兼CTO王昊在介紹WALL-B
完整工程閉環(huán):機器人領域領先窗口或達三年以上
王潛在接受澎湃新聞等媒體采訪時表示,機器人進家庭目前并非百分百只靠AI模型去做,有時候還是得有人去在安全性等方面兜底和接管,但除了地形限制、工具太過復雜等情況外,所有能夠在物理上實現(xiàn)的事情,其實機器人都能做,“只要進入家庭,你就可以使喚它,不需要再考慮有什么是能做的,有什么是不能做的”。
王潛認為,企業(yè)長久的競爭力在于建立一個真正統(tǒng)一的閉環(huán)體系。相較于算法架構(gòu),模型背后的數(shù)據(jù)定義、采集、改造、后處理以及訓練測評調(diào)整等完整的工程體系,才是最難被復制的部分。他以大模型行業(yè)為例稱,OpenAI曾領先谷歌近兩年,而在機器人領域,這樣的領先時間窗口會更長,可能達到三年以上。
值得一提的是,在發(fā)布會上,王潛也正式宣布自變量于近日完成了B輪融資,由小米戰(zhàn)投領投。此前有報道稱,自變量完成了近20億元的B輪融資,也成為國內(nèi)公開披露的唯一一家被四家互聯(lián)網(wǎng)大廠(字節(jié)、美團、阿里、小米)投資的具身智能企業(yè)。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




