今日凌晨,由李飛飛聯(lián)合創(chuàng)立的空間智能公司W(wǎng)orld Labs推出了他們的最新生成式世界模型——“實(shí)時(shí)幀模型”(Real-Time Frame Model,RTFM)。
該模型能夠在與你交互的過程中實(shí)時(shí)生成持續(xù)的、3D 一致的視頻幀,且只需一塊 H100 GPU 即可運(yùn)行!
(資料圖片僅供參考)
這項(xiàng)研究探索了如何解決生成式世界模型的高計(jì)算資源需求難題,這是未來在渲染與空間智能領(lǐng)域中必須探索的關(guān)鍵研究方向。
要知道,世界模型的算力需求遠(yuǎn)超當(dāng)前的大語言模型(LLM),例如維持一小時(shí)的持久交互,需要處理超過1 億 token 的上下文。
RTFM 的關(guān)鍵貢獻(xiàn)在于,它提供了一個(gè)在當(dāng)今硬件上部署的未來世界模型的愿景,并確立了一種將世界模型視為從數(shù)據(jù)中端到端學(xué)習(xí)的渲染器的技術(shù)方法。
值得一提的是,你可以無限與 RTFM 互動(dòng),由你構(gòu)建的世界永不消逝。未來,可擴(kuò)展的 RTFM 還將支持建模動(dòng)態(tài)世界,并允許用戶與生成的世界進(jìn)行交互。
1.效率(Efficiency)
RTFM 的核心目標(biāo)是:在單張 H100 GPU 上實(shí)現(xiàn)實(shí)時(shí)、可交互的世界生成。通過優(yōu)化模型架構(gòu)、推理?xiàng):驼麴s技術(shù),它在現(xiàn)有硬件上展現(xiàn)出“未來級(jí)”的生成性能,證明了高效世界模型的可行性。
2.可擴(kuò)展性(Scalability)
不同于傳統(tǒng)依賴顯式 3D 結(jié)構(gòu)的渲染管線,RTFM 并不會(huì)顯式地構(gòu)建世界的 3D 表征。相反,它以一張或多張 2D 圖像作為輸入,直接生成來自不同視角的同一場(chǎng)景的 2D 圖像。
RTFM 可以被視為一種“學(xué)習(xí)型渲染器”:它是一個(gè)自回歸擴(kuò)散 Transformer 模型,基于大規(guī)模視頻數(shù)據(jù)進(jìn)行端到端訓(xùn)練,通過觀察訓(xùn)練集中的場(chǎng)景,學(xué)會(huì)建模 3D 幾何、反射、陰影等特征,并在輸入視角稀缺時(shí)進(jìn)行外推生成。
視頻|通過結(jié)合 RTFM 與 Marble 技術(shù),可以從單張圖像中創(chuàng)建 3D 世界。RTFM 可渲染復(fù)雜效果,如光照與反射,這些效果均通過端到端學(xué)習(xí)從數(shù)據(jù)中習(xí)得。場(chǎng)景:RTFM 處理薄玻璃結(jié)構(gòu)。
視頻|利用 RTFM 技術(shù)從短視頻中渲染真實(shí)世界場(chǎng)景。場(chǎng)景:RTFM 模型在電視屏幕中模擬復(fù)雜反射。
3.持續(xù)性(Persistence)
RTFM 通過為每幀引入 3D 姿態(tài),使模型的“記憶”具備空間結(jié)構(gòu),從而實(shí)現(xiàn)世界的長期一致性。它利用“空間記憶”與“上下文切換”機(jī)制,在不同區(qū)域動(dòng)態(tài)調(diào)用相關(guān)幀,實(shí)現(xiàn)長時(shí)交互下的大規(guī)模世界持久生成。
視頻|RTFM 結(jié)合上下文切換技術(shù),使其能夠在大場(chǎng)景中保持幾何體持久化,同時(shí)保持高效運(yùn)行。場(chǎng)景:采用 RTFM 渲染技術(shù)呈現(xiàn)的游廊,表面泛著光澤的反射效果
整理:喬治
如需轉(zhuǎn)載或投稿,請(qǐng)直接在公眾號(hào)內(nèi)留言
凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。
原標(biāo)題:文化交流讓兩岸同胞心更近、情更濃(主題)——訪閩臺(tái)歷史文化
2023-09-12 09:56
原標(biāo)題:暑期檔中國電影觀眾滿意度調(diào)查出爐(引題)?6部影片滿意度超8
2023-09-12 09:57
原標(biāo)題:河北發(fā)現(xiàn)完整“熱河生物群”恐龍化石人民日?qǐng)?bào)石家莊9月11日電
2023-09-12 09:59
原標(biāo)題:2023國際青年設(shè)計(jì)師邀請(qǐng)賽周五開賽(引題)?居庸關(guān)長城“跨界
2023-09-12 09:55
原標(biāo)題:“福運(yùn)武清”鄉(xiāng)村振興主題文學(xué)創(chuàng)作采風(fēng)活動(dòng)舉行(引題)?市作
2023-09-12 09:57
原標(biāo)題:當(dāng)“非遺藤編”走向世界工人日?qǐng)?bào)-中工網(wǎng)記者徐福平陳子蘊(yùn)一樓
2023-09-09 14:57
原標(biāo)題:工業(yè)題材電影創(chuàng)作研討會(huì)在京舉辦工人日?qǐng)?bào)-中工網(wǎng)記者陳俊宇9月
2023-09-09 15:07
原標(biāo)題:2024中國國際時(shí)裝周時(shí)裝大秀綻放女性力量中新網(wǎng)北京9月8日電(
2023-09-09 14:54
原標(biāo)題:《別董大》原來是高適的“蹭飯”詩“千里黃云白日曛,北風(fēng)吹雁
2023-09-09 15:01
原標(biāo)題:周杰倫天津演唱會(huì)發(fā)生意外?經(jīng)紀(jì)公司凌晨回應(yīng)9月8日晚,周杰倫
2023-09-09 15:02
原標(biāo)題:“灣仔之狼”馬家輝:要讀書,就要讀經(jīng)典讀書有多好,不必再多
2023-09-09 08:06
原標(biāo)題:反套路、反類型《云之羽》打造新江湖武俠劇中新網(wǎng)9月8日電?由
2023-09-09 08:02
原標(biāo)題:第48屆多倫多國際電影節(jié)啟幕多部華語影片亮相中新社多倫多9月7
2023-09-09 08:05
原標(biāo)題:聚焦青年作家創(chuàng)作“新文化與新時(shí)代青年寫作”主題論壇舉辦中新
2023-09-08 15:03
原標(biāo)題:大作云集第十屆烏鎮(zhèn)戲劇節(jié)將于10月啟幕中新網(wǎng)北京9月7日電(記
2023-09-08 15:06
原標(biāo)題:第十屆烏鎮(zhèn)戲劇節(jié)將啟匯集11個(gè)國家與地區(qū)劇目中新網(wǎng)嘉興9月7日
2023-09-08 15:00
原標(biāo)題:浙江湖州推出文旅亞運(yùn)主題線路助力文旅產(chǎn)業(yè)9月6日,游客在游覽
2023-09-08 14:58
原標(biāo)題:帕米爾高原上的歌舞情緣新疆塔什庫爾干塔吉克自治縣(以下簡稱
2023-09-08 15:04
原標(biāo)題:張藝謀新片《堅(jiān)如磐石》舉行發(fā)布會(huì)北京日?qǐng)?bào)記者袁云兒張藝謀首
2023-09-08 10:56
原標(biāo)題:《相約敦煌》文藝晚會(huì)上演9月6日,演員在《相約敦煌》文藝晚會(huì)
2023-09-08 11:02
原標(biāo)題:喀什英吉沙:傳承民族特色體驗(yàn)非遺魅力9月5日,手工藝人在英吉
2023-09-08 10:56
原標(biāo)題:“名家讀經(jīng)典”系列首期:阿來解讀《瓦爾登湖》中新網(wǎng)北京9月7
2023-09-08 10:56
原標(biāo)題:《封神三部曲》用“東方敘事”助力在國際銀屏上講好“中國故事
2023-09-08 10:56
原標(biāo)題:樊錦詩等,獲聯(lián)合國教科文組織頒獎(jiǎng)賈釗程楠非物質(zhì)文化遺產(chǎn)促進(jìn)
2023-09-08 10:06
原標(biāo)題:一條古道串起顆顆文化“明珠”(引題)石景山區(qū)打造京西“活態(tài)
2023-09-08 10:02