4月16日,阿里巴巴(以下簡稱阿里)發布可實時構建和交互的世界模型產品——HappyOyster(快樂生蠔)。該產品由阿里ATH(Alibaba Token Hub)創新事業部團隊研發,與此前爆火的HappyHorse(快樂馬)同屬一個團隊。
《每日經濟新聞》記者了解到,HappyOyster基于原生多模態架構而建,支持多模態理解與音視頻聯合生成。目前,該產品可實現漫游(Wander)和導演(Direct)兩大核心能力,用戶可以實時構建可互動、可演繹、可探索的AI數字世界。同時,用戶生成的數字世界,不僅能被完整保存,還能開放給其他用戶進行二次創作。
相比大語言模型相對成熟的模型架構和技術范式,世界模型仍屬于前沿探索領域。阿里的HappyOyster與谷歌的Genie 3同屬于世界模擬器流派。區別在于傳統文生視頻模型采用輸入提示詞、等待渲染、獲得成片的被動流程,而這一流派采用長時間跨度上的世界演化建模方式。通過學習海量長視頻數據,以及文本、動作指令、圖像參考等多樣控制信號,模型能夠主動理解空間、物理與因果規律,預測情節和畫面的演變,從而把“被動生成內容”轉變為“主動模擬世界演化”,為構建可交互的通用世界模擬器提供了關鍵技術路徑。