論文の概要: PanoWorld: A Generative Spatial World Model for Consistent Whole-House Panorama Synthesis
- arxiv url: http://arxiv.org/abs/2605.17916v2
- Date: Tue, 19 May 2026 02:30:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.56431
- Title: PanoWorld: A Generative Spatial World Model for Consistent Whole-House Panorama Synthesis
- Title(参考訳): パノワールド:一貫した住宅パノラマ合成のための空間空間モデル
- Authors: Jinrang Jia, Zhenjia Li, Yijiang Hu, Yifeng Shi,
- Abstract要約: パノワールド(英: PanoWorld)は、ノードベースのパノラマの自動回帰生成としてハウス全体の合成を扱う生成空間世界モデルである。
クロスノードレイアウトとマテリアル一貫性を改善しつつ、高周波2D合成品質を保っている。
- 参考スコア(独自算出の注目度): 9.056861577664717
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating a consistent whole-house VR tour from a floorplan and style reference requires both photorealistic panoramas and cross-view spatial coherence. Pure 2D generators produce appealing single panoramas but re-imagine geometry and materials when the viewpoint changes, whereas monolithic 3D generation becomes expensive and loses fine texture at multi-room scale. We introduce PanoWorld, a generative spatial world model that treats whole-house synthesis as autoregressive generation of node-based 360-degree panoramas, matching the discrete navigation used by real VR tour products. PanoWorld uses a floorplan-derived 3D shell as a global geometric proxy and a dynamic 3D Gaussian Splatting cache as renderable spatial memory. A feed-forward panoramic LRM designed for metric-scale multi-room 360-degree inputs lifts generated panoramas into local 3DGS updates, while Room-aware Group Attention suppresses cross-room feature interference. A topology-aware progressive caching strategy fuses these local updates without repeatedly reconstructing the full history. By decoupling shell-based geometry guidance from cache-rendered visual memory, PanoWorld preserves high-frequency 2D synthesis quality while improving cross-node layout and material consistency. The project link is https://jjrcn.github.io/PanoWorld-project-home/
- Abstract(参考訳): フロアプランとスタイル参照から一貫した全室VRツアーを生成するには、フォトリアリスティックパノラマとクロスビュー空間コヒーレンスの両方が必要である。
純粋な2Dジェネレータは、1つのパノラマを魅力的に生成するが、視点が変化すると幾何学や材料を再想像する一方、モノリシックな3D生成は高価になり、マルチルームスケールで微細なテクスチャを失う。
パノワールド(PanoWorld)は、実際のVRツアー製品で使用される個別のナビゲーションと一致する、ノードベースの360度パノラマの自動回帰生成として、家庭全体の合成を扱う生成空間世界モデルである。
PanoWorldはフロアプラン由来の3Dシェルをグローバルな幾何学的プロキシとして、ダイナミックな3Dガウススプラッティングキャッシュをレンダリング可能な空間メモリとして使用している。
メトリスケールのマルチルーム360度入力用に設計されたフィードフォワードパノラマLEMは、生成されたパノラマをローカル3DGS更新にリフトし、Room-aware Group Attentionは、クロスルーム機能干渉を抑制する。
トポロジ対応のプログレッシブキャッシュ戦略は、すべての履歴を再構築することなく、これらのローカルアップデートを融合させる。
キャッシュレンダリングされたビジュアルメモリからシェルベースの幾何学的ガイダンスを分離することにより、PanoWorldは、クロスノードレイアウトとマテリアル一貫性を改善しながら、高周波2D合成品質を保ちます。
プロジェクトリンクはhttps://jjrcn.github.io/PanoWorld-project-home/
関連論文リスト
- PanoWorld: Geometry-Consistent Panoramic Video World Modeling [31.274777055274345]
パノラマビデオワールドモデル(パノラマビデオワールドモデル、パノラマビデオワールドモデル)を提示する。
パノワールドは、競争力のある視覚リアリズムを維持しながら、以前のパノラマ生成法よりも幾何的整合性を向上させる。
論文 参考訳(メタデータ) (2026-05-14T20:24:23Z) - OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes [57.790894531046796]
パノラマをベースとした2Dリフトは、没入型でリアルで多様な3D環境を作り出すための有望な技術として登場した。
本研究では、物理ベースレンダリング(PBR)、リライティング、シミュレーションに適したグラフィックス対応の3Dシーンを生成するために、この手法を推し進める。
我々の重要な洞察は、幾何学、テクスチャ、PBR材料のパノラマ知覚のための2次元生成モデルを再利用することである。
軽量で効率的なクロスモーダルアダプタ構造に基づいて、OmniXは幅広いパノラマ視覚タスクのために2D生成の先行を再利用する。
論文 参考訳(メタデータ) (2025-10-30T17:59:51Z) - TiP4GEN: Text to Immersive Panorama 4D Scene Generation [82.8444414014506]
TiP4GENはテキストから動的パノラマシーン生成フレームワークである。
微粒なコンテンツ制御を可能にし、動きに富んだ幾何学的なパノラマ4Dシーンを合成する。
TiP4GENはパノラマビデオ生成と動的シーン再構成を統合し、360度没入型仮想環境を作成する。
論文 参考訳(メタデータ) (2025-08-17T16:02:24Z) - Matrix-3D: Omnidirectional Explorable 3D World Generation [20.568791715708134]
広視野全方位3次元世界生成のためのパノラマ表現を利用するフレームワークMatrix-3Dを提案する。
まず,シーンメッシュレンダリングを条件として,軌跡誘導パノラマ動画拡散モデルを訓練する。
本研究では, パノラマシーン映像を3次元世界へ持ち上げるために, (1) 高速3次元シーン再構成のためのフィードフォワード大パノラマ再構成モデル, (2) 正確かつ詳細な3次元シーン再構成のための最適化ベースパイプラインの2つの方法を提案する。
論文 参考訳(メタデータ) (2025-08-11T15:29:57Z) - Top2Pano: Learning to Generate Indoor Panoramas from Top-Down View [1.182769785560032]
Top2Panoは、トップダウンビューからリアルな屋内パノラマのエンドツーエンドモデルである。
提案手法は, 3次元構造を推定するために体積占有量を推定し, 粗い色と深度パノラマを生成するために体積レンダリングを用いる。
論文 参考訳(メタデータ) (2025-07-28T22:32:41Z) - LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation [105.52153675890408]
3D没入型シーン生成はコンピュータビジョンとグラフィックスにおいて難しいが重要な課題である。
Layerpano3Dは、単一のテキストプロンプトからフルビューで探索可能なパノラマ3Dシーンを生成するための新しいフレームワークである。
論文 参考訳(メタデータ) (2024-08-23T17:50:23Z) - Pano2Room: Novel View Synthesis from a Single Indoor Panorama [20.262621556667852]
Pano2Roomは、1枚のパノラマ画像から高品質な3D屋内シーンを自動的に再構築するように設計されている。
鍵となるアイデアは、最初に入力パノラマから予備メッシュを構築し、パノラマRGBDインペイントを使用して反復的にこのメッシュを洗練することである。
精巧なメッシュは3次元ガウス散乱場に変換され、収集された擬似ノベルビューで訓練される。
論文 参考訳(メタデータ) (2024-08-21T08:19:12Z) - DreamScene360: Unconstrained Text-to-3D Scene Generation with Panoramic Gaussian Splatting [56.101576795566324]
テキストから3D 360$circ$のシーン生成パイプラインを提示する。
提案手法は, 2次元拡散モデルの生成力を利用して, 自己複製を促進する。
当社の手法は,360ドル(約3万2000円)の視野内で,グローバルに一貫した3Dシーンを提供する。
論文 参考訳(メタデータ) (2024-04-10T10:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。