論文の概要: LivingWorld: Interactive 4D World Generation with Environmental Dynamics
- arxiv url: http://arxiv.org/abs/2604.01641v1
- Date: Thu, 02 Apr 2026 05:38:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.3778
- Title: LivingWorld: Interactive 4D World Generation with Environmental Dynamics
- Title(参考訳): LivingWorld: インタラクティブな4Dワールドジェネレーションと環境ダイナミクス
- Authors: Hyeongju Mun, In-Hwan Jin, Sohyeong Kim, Kyeongbo Kong,
- Abstract要約: リビングワールド(LivingWorld)は、1つの画像から環境動態を持つ4次元世界を生成するインタラクティブなフレームワークである。
LivingWorldはこの課題に対処し、シーンが拡大するにつれて、グローバルなコヒーレントなモーションフィールドを徐々に構築する。
我々はさらに、コンパクトなハッシュベースの運動場を用いて動きを表現し、シーン全体にわたって効率的なクエリと安定した動的伝播を可能にする。
- 参考スコア(独自算出の注目度): 8.868060488503847
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce LivingWorld, an interactive framework for generating 4D worlds with environmental dynamics from a single image. While recent advances in 3D scene generation enable large-scale environment creation, most approaches focus primarily on reconstructing static geometry, leaving scene-scale environmental dynamics such as clouds, water, or smoke largely unexplored. Modeling such dynamics is challenging because motion must remain coherent across an expanding scene while supporting low-latency user feedback. LivingWorld addresses this challenge by progressively constructing a globally coherent motion field as the scene expands. To maintain global consistency during expansion, we introduce a geometry-aware alignment module that resolves directional and scale ambiguities across views. We further represent motion using a compact hash-based motion field, enabling efficient querying and stable propagation of dynamics throughout the scene. This representation also supports bidirectional motion propagation during rendering, producing long and temporally coherent 4D sequences without relying on expensive video-based refinement. On a single RTX 5090 GPU, generating each new scene expansion step requires 9 seconds, followed by 3 seconds for motion alignment and motion field updates, enabling interactive 4D world generation with globally coherent environmental dynamics. Video demonstrations are available at cvsp-lab.github.io/LivingWorld.
- Abstract(参考訳): リビングワールド(LivingWorld)は、1つの画像から環境動態を持つ4次元世界を生成するインタラクティブなフレームワークである。
近年の3Dシーン生成の進歩は大規模な環境生成を可能にしているが、ほとんどのアプローチは、主に静的な幾何学の再構築に焦点を当てており、雲や水、煙といったシーンスケールの環境ダイナミクスは、ほとんど探索されていない。
このようなダイナミクスのモデリングは、低レイテンシのユーザフィードバックをサポートしながら、動きは拡大するシーン全体で一貫性を保たなければならないため、難しい。
LivingWorldはこの課題に対処し、シーンが拡大するにつれて、グローバルなコヒーレントなモーションフィールドを徐々に構築する。
拡張時のグローバルな整合性を維持するため,ビュー間の方向やスケールのあいまいさを解消する幾何対応アライメントモジュールを導入する。
我々はさらに、コンパクトなハッシュベースの運動場を用いて動きを表現し、シーン全体にわたって効率的なクエリと安定した動的伝播を可能にする。
この表現はまた、レンダリング中の双方向のモーション伝搬をサポートし、高価なビデオベースの精細化に頼ることなく、長時間かつ時間的にコヒーレントな4Dシーケンスを生成する。
1つのRTX 5090 GPUでは、新しいシーン展開ステップを生成するのに9秒を必要とし、その後3秒で動きのアライメントとモーションフィールドが更新され、グローバルなコヒーレントな環境ダイナミクスを備えたインタラクティブな4Dワールドジェネレーションが可能になる。
ビデオデモはcvsp-lab.github.io/LivingWorldで公開されている。
関連論文リスト
- MotionScale: Reconstructing Appearance, Geometry, and Motion of Dynamic Scenes with Scalable 4D Gaussian Splatting [54.859943475818234]
MotionScaleは、4Dガウススティングフレームワークで、大きなシーンや拡張シーケンスに効率よくスケールする。
挑戦的な実世界のベンチマークの実験では、MotionScaleは復元品質と時間的安定性の両方において最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2026-03-31T06:03:59Z) - TeleWorld: Towards Dynamic Multimodal Synthesis with a 4D World Model [53.555353366322464]
我々は,映像生成,動的シーン再構成,長期記憶をクローズドループシステム内で統合するリアルタイム多モード4DワールドモデリングフレームワークTeleWorldを提案する。
提案手法は,動的オブジェクトモデリングと静的シーン表現のシームレスな統合を実現し,現実的でインタラクティブで計算可能な合成システムに向けて世界モデルを推し進める。
論文 参考訳(メタデータ) (2025-12-31T18:31:46Z) - Dexterous World Models [24.21588354488453]
Dexterous World Model (DWM) はシーンアクション条件付きビデオ拡散フレームワークである。
本稿では,DWMが時間的コヒーレントな映像を生成する方法を示す。
実験により、DWMは、つかむ、開く、動く物体など、現実的で物理的に妥当な相互作用を可能にすることが示されている。
論文 参考訳(メタデータ) (2025-12-19T18:59:51Z) - WorldReel: 4D Video Generation with Consistent Geometry and Motion Modeling [63.37476802589492]
We present WorldReel, a 4D video that are native-temporally consistent。
WorldReelは、ポイントマップ、カメラ軌道、高密度フローを含む4Dシーン表現と共にフレームを生成する。
We believe that WorldReel bring video generation to 4D-consistent world modeling。
論文 参考訳(メタデータ) (2025-12-08T18:54:12Z) - SyncMV4D: Synchronized Multi-view Joint Diffusion of Appearance and Motion for Hand-Object Interaction Synthesis [47.61773799705708]
同期多視点HOIビデオと4Dモーションを共同生成する最初のモデルであるSyncMV4Dを紹介する。
本手法は,視覚リアリズム,運動可視性,多視点整合性において,最先端の代替手段よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-11-24T17:14:19Z) - Seeing World Dynamics in a Nutshell [132.79736435144403]
NutWorldはモノクロ動画をダイナミックな3D表現に変換するフレームワークである。
我々は,NutWorldがリアルタイムにダウンストリームアプリケーションを実現しつつ,高忠実度ビデオ再構成品質を実現することを実証した。
論文 参考訳(メタデータ) (2025-02-05T18:59:52Z) - 4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives [115.67081491747943]
動的3Dシーン表現と新しいビュー合成はAR/VRおよびメタバースアプリケーションの実現に不可欠である。
我々は,その基礎となる4次元体積を近似として,時間変化の異なる3次元シーンの再構成を再構成する。
ストレージのボトルネックに対処するため、メモリフットプリントを効果的に削減するいくつかのコンパクトなバリエーションを導出する。
論文 参考訳(メタデータ) (2024-12-30T05:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。