由字節跳動推出的自研豆包大模型團隊,聯合北京交通大學及中國科學技術大學共同開發的視頻生成實驗模型「VideoWorld」正式開源,首次實現無需依賴語言模型即可認知世界。據悉,「VideoWorld」與Sora、DALL- E及Midjourney等主流多模態模型不同,其創新性在於完全基於視覺理解世界。(ta/a)~阿思達克財經新聞網址: www.aastocks.com