近日,具身領(lǐng)域熱門榜單 WorldArena Track1(世界模型感知與動(dòng)作響應(yīng)賽道)最新評(píng)測(cè)結(jié)果揭曉。智元自研的世界模型 Genie Envisioner-Sim 2.0(簡(jiǎn)稱“GE 2.0”)綜合表現(xiàn)登頂榜單榜首。
據(jù)介紹,這一賽道聚焦具身智能最本質(zhì)的“認(rèn)知與行動(dòng)”能力,是衡量通用人形機(jī)器人智能化水平的重要標(biāo)尺。智元表示,其使用的是原生的世界模型GE 2.0,僅基于榜單數(shù)據(jù)做了基礎(chǔ)微調(diào),并未針對(duì)賽題進(jìn)行特殊優(yōu)化,印證了GE 2.0較強(qiáng)的通用適配性。
在GE 2.0技術(shù)報(bào)告中,智元團(tuán)隊(duì)對(duì)模型進(jìn)行了全面的能力剖析。相比上一代模型,GE 2.0不僅在單點(diǎn)性能上實(shí)現(xiàn)了躍升,更真正演進(jìn)為一個(gè)全功能、高可用的世界模擬器,可構(gòu)建可試錯(cuò)、可迭代、可進(jìn)化的虛擬仿真環(huán)境,讓機(jī)器人策略在虛擬場(chǎng)景中自主積累經(jīng)驗(yàn)、完成動(dòng)態(tài)試錯(cuò),規(guī)避真實(shí)場(chǎng)景的試錯(cuò)成本,最終高效遷移至真實(shí)物理世界穩(wěn)定落地,真正實(shí)現(xiàn)從“感知預(yù)測(cè)”到“仿真進(jìn)化、自主決策”的閉環(huán)升級(jí)。
具體來(lái)看,GE 2.0在功能上首次全面覆蓋了長(zhǎng)時(shí)序生成、多視角生成、本體狀態(tài)生成、近實(shí)時(shí)推理以及獎(jiǎng)勵(lì)判別等核心環(huán)節(jié),構(gòu)建了世界模擬器完整的技術(shù)能力閉環(huán)。
在長(zhǎng)時(shí)序推理任務(wù)中,GE 2.0表現(xiàn)出較強(qiáng)的穩(wěn)定性,畫(huà)面質(zhì)量隨推理時(shí)長(zhǎng)的衰減顯著弱于行業(yè)基線方案。即使在連續(xù)推演40—50秒的長(zhǎng)視頻片段時(shí),其生成質(zhì)量依然超越了基線模型前10秒內(nèi)的表現(xiàn)。
2026年是具身智能“部署態(tài)”元年,機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場(chǎng)景,規(guī)模化部署,真正發(fā)揮具身智能生產(chǎn)力,這也對(duì)算法提出了更高的要求。
世界模型是通往物理AI的必經(jīng)之路。今年以來(lái),機(jī)器人大腦和世界模型已成為具身智能領(lǐng)域新的投融資熱點(diǎn)。2月,“有AI教母“之稱的李飛飛,其World Labs完成10億美元融資,英偉達(dá)和AMD罕見(jiàn)同時(shí)押注;3月,楊立昆的AMI Labs獲得10.3億美元種子輪,創(chuàng)下歐洲AI領(lǐng)域種子輪融資紀(jì)錄;4月,專注世界模型的極佳視界在一個(gè)月內(nèi)連拿兩輪合計(jì)25億元,并宣稱成為國(guó)內(nèi)首個(gè)世界模型百億獨(dú)角獸。
據(jù)不完全統(tǒng)計(jì),4月我國(guó)具身智能領(lǐng)域大額融資披露,包括憶生科技、晨昏線科技、蘇度科技、德塔源創(chuàng)、章魚(yú)動(dòng)力、知躍空間智能、地瓜機(jī)器人等,融資企業(yè)均聚焦具身智能核心賽道,圍繞具身智能大腦、世界模型及相關(guān)底層技術(shù)展開(kāi)。
智元表示,未來(lái)將持續(xù)迭代世界模擬器技術(shù)體系,打通具身智能技術(shù)閉環(huán),推動(dòng)世界模型真正走進(jìn)真實(shí)場(chǎng)景,為人形機(jī)器人規(guī)模化落地筑牢核心技術(shù)底座。