論文の概要: Stitch4D: Sparse Multi-Location 4D Urban Reconstruction via Spatio-Temporal Interpolation
- arxiv url: http://arxiv.org/abs/2604.07923v1
- Date: Thu, 09 Apr 2026 07:45:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.773989
- Title: Stitch4D: Sparse Multi-Location 4D Urban Reconstruction via Spatio-Temporal Interpolation
- Title(参考訳): Stitch4D:時空間補間によるスパース多地点4D都市再建
- Authors: Hina Kogure, Kei Katsumata, Taiki Miyanishi, Komei Sugiura,
- Abstract要約: スパース観測における空間被覆の欠如を明示的に補償する統合された4次元再構成フレームワークを提案する。
最適化前の中間カバレッジを復元することにより、Stitch4Dは幾何学的崩壊を防止し、コヒーレントな幾何学と滑らかなシーンダイナミクスを再構築する。
U-S4D実験の結果,Stitch4Dは代表的4次元再構成ベースラインを超越し,視覚的品質が向上した。
- 参考スコア(独自算出の注目度): 5.878115656035432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic urban environments are often captured by cameras placed at spatially separated locations with little or no view overlap. However, most existing 4D reconstruction methods assume densely overlapping views. When applied to such sparse observations, these methods fail to reconstruct intermediate regions and often introduce temporal artifacts. To address this practical yet underexplored sparse multi-location setting, we propose Stitch4D, a unified 4D reconstruction framework that explicitly compensates for missing spatial coverage in sparse observations. Stitch4D (i) synthesizes intermediate bridge views to densify spatial constraints and improve spatial coverage, and (ii) jointly optimizes real and synthesized observations within a unified coordinate frame under explicit inter-location consistency constraints. By restoring intermediate coverage before optimization, Stitch4D prevents geometric collapse and reconstructs coherent geometry and smooth scene dynamics even in sparsely observed environments. To evaluate this setting, we introduce Urban Sparse 4D (U-S4D), a CARLA-based benchmark designed to assess spatiotemporal alignment under sparse multi-location configurations. Experimental results on U-S4D show that Stitch4D surpasses representative 4D reconstruction baselines and achieves superior visual quality. These results indicate that recovering intermediate spatial coverage is essential for stable 4D reconstruction in sparse urban environments.
- Abstract(参考訳): ダイナミックな都市環境は、視界の重なりがほとんどあるいは全くない空間的に分離された場所に配置されたカメラによって撮影されることが多い。
しかし、既存の4次元再構成手法の多くは、重なり合うビューを前提としている。
このようなスパース観測に適用すると、これらの手法は中間領域の再構築に失敗し、しばしば時間的アーティファクトを導入する。
この実用的で未探索のスパースマルチロケーション設定に対処するために、スパース観測における空間被覆の欠如を明示的に補償する統合された4D再構成フレームワークであるStitch4Dを提案する。
Stitch4D
二 中間ブリッジビューを合成して空間的制約を密度化し、空間的カバレッジを向上させること。
(II) 明示的な位置間整合性制約の下で、統一座標フレーム内の実・合成観測を共同で最適化する。
最適化前の中間カバレッジを復元することで、Stitch4Dは幾何的崩壊を防ぎ、わずかに観察された環境においても、コヒーレントな幾何学と滑らかなシーンダイナミクスを再構築する。
この設定を評価するために,CARLAに基づくマルチロケーション構成下での時空間アライメント評価のためのベンチマークであるUrban Sparse 4D(U-S4D)を導入する。
U-S4D実験の結果,Stitch4Dは代表的4次元再構成ベースラインを超越し,視覚的品質が向上した。
これらの結果から, 疎都市環境の安定な4次元再構築には, 中間空間被覆の回復が不可欠であることが示唆された。
関連論文リスト
- Orthogonal Spatial-temporal Distributional Transfer for 4D Generation [58.30004328671699]
既存の3次元拡散モデルと時間的拡散モデルから豊かな空間的先行を転送し、4次元合成を強化するフレームワークを提案する。
空間・時間差4D(STD-4D)拡散モデルを構築し,空間・時間差による4D映像を合成する。
実験の結果,提案手法は従来の手法よりも優れ,空間的時間的整合性と高品質な4D合成を実現していることがわかった。
論文 参考訳(メタデータ) (2026-03-05T11:52:21Z) - 4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere [77.83037497484366]
単眼ビデオからの4次元再構成のための統合フィードフォワードフレームワークである4RCを提案する。
4RCは、密集したシーン形状と動きのダイナミクスを共同でキャプチャする総体的な4D表現を学習する。
論文 参考訳(メタデータ) (2026-02-10T18:57:04Z) - Geometry-Consistent 4D Gaussian Splatting for Sparse-Input Dynamic View Synthesis [17.560425604804305]
GC-4DGSは幾何学的整合性を4次元ガウススプラッティング(4DGS)に注入する新しいフレームワークである
幾何学的整合性を4次元ガウススプラッティング(4DGS)に注入する新しいフレームワークであるGC-4DGSを提案する。
論文 参考訳(メタデータ) (2025-11-28T10:11:48Z) - P-4DGS: Predictive 4D Gaussian Splatting with 90$\times$ Compression [26.130131551764077]
3D Gaussian Splatting (3DGS) は、シーン表現の忠実さとリアルタイムレンダリング性能が優れており、注目されている。
有望な結果を得たにもかかわらず、既存のアルゴリズムのほとんどは、動的シーンに固有の時間的および空間的冗長性を見落としている。
コンパクトな4次元シーンモデリングのための新しい動的3DGS表現であるP-4DGSを提案する。
論文 参考訳(メタデータ) (2025-10-11T05:19:41Z) - Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency [49.875459658889355]
Free4Dは、単一の画像から4Dシーンを生成するためのチューニング不要のフレームワークである。
我々の重要な洞察は、一貫した4次元シーン表現のために、事前訓練された基礎モデルを蒸留することである。
結果の4D表現はリアルタイムで制御可能なレンダリングを可能にする。
論文 参考訳(メタデータ) (2025-03-26T17:59:44Z) - DiST-4D: Disentangled Spatiotemporal Diffusion with Metric Depth for 4D Driving Scene Generation [50.01520547454224]
現在の生成モデルは、時空間外挿と空間新規ビュー合成(NVS)を同時にサポートする4次元駆動シーンの合成に苦慮している
本研究では,2つの拡散過程に分散するDiST-4Dを提案する。DST-Tは過去の観測結果から直接,将来の距離深度と多視点RGBシーケンスを予測し,DST-Sは,既存の視点でのみ空間的NVSを訓練し,サイクル整合性を実現する。
実験により、DiST-4Dは時間的予測とNVSタスクの両方において最先端のパフォーマンスを達成し、同時に計画関連評価において競合性能を提供することが示された。
論文 参考訳(メタデータ) (2025-03-19T13:49:48Z) - Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving [116.10577967146762]
マルチビュー画像シーケンスからフレーム単位のポイントマップを直接回帰するフレームワークであるDriv3Rを提案する。
我々は4次元フロー予測器を用いてシーン内の移動物体を識別し、これらの動的領域の再構築をより重視する。
Driv3Rは4D動的シーン再構築において従来のフレームワークより優れており、推論速度は15倍高速である。
論文 参考訳(メタデータ) (2024-12-09T18:58:03Z) - 4DRecons: 4D Neural Implicit Deformable Objects Reconstruction from a single RGB-D Camera with Geometrical and Topological Regularizations [35.161541396566705]
4DReconsは出力を4Dの暗黙の表面としてエンコードする。
4DReconsは大きな変形や複雑な部品間相互作用を処理可能であることを示す。
論文 参考訳(メタデータ) (2024-06-14T16:38:00Z) - LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human
Modeling [69.56581851211841]
そこで我々は,LoRDという,動的に衣を着る人間の局所的な4D暗黙表現を提案する。
私たちの重要な洞察は、ネットワークがローカルな部分レベルの表現の潜在コードを学ぶように促すことです。
LoRDは、4D人間を表現する能力が強く、実用上の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-08-18T03:49:44Z) - Learning Parallel Dense Correspondence from Spatio-Temporal Descriptors
for Efficient and Robust 4D Reconstruction [43.60322886598972]
本稿では,点雲列からの4次元形状再構成の課題に焦点をあてる。
本稿では,クロスフレーム占有領域間の連続的変換関数を捉えることにより,人間の3次元形状の時間変化を学ぶための新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2021-03-30T13:36:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。