論文の概要: RayMap3R: Inference-Time RayMap for Dynamic 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2603.20588v1
- Date: Sat, 21 Mar 2026 01:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.98613
- Title: RayMap3R: Inference-Time RayMap for Dynamic 3D Reconstruction
- Title(参考訳): RayMap3R:動的3次元再構成のための推論時レイマップ
- Authors: Feiran Wang, Zezhou Shang, Gaowen Liu, Yan Yan,
- Abstract要約: ストリームフィードフォワード3D再構成により,RGB画像からシーン形状とカメラポーズをリアルタイムに同時推定できる。
動的シーン再構成のためのトレーニング不要ストリーミングフレームワークRayMap3Rを提案する。
- 参考スコア(独自算出の注目度): 22.98233376526841
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Streaming feed-forward 3D reconstruction enables real-time joint estimation of scene geometry and camera poses from RGB images. However, without explicit dynamic reasoning, streaming models can be affected by moving objects, causing artifacts and drift. In this work, we propose RayMap3R, a training-free streaming framework for dynamic scene reconstruction. We observe that RayMap-based predictions exhibit a static-scene bias, providing an internal cue for dynamic identification. Based on this observation, we construct a dual-branch inference scheme that identifies dynamic regions by contrasting RayMap and image predictions, suppressing their interference during memory updates. We further introduce reset metric alignment and state-aware smoothing to preserve metric consistency and stabilize predicted trajectories. Our method achieves state-of-the-art performance among streaming approaches on dynamic scene reconstruction across multiple benchmarks.
- Abstract(参考訳): ストリームフィードフォワード3D再構成により,RGB画像からシーン形状とカメラポーズをリアルタイムに同時推定できる。
しかし、明示的な動的推論がなければ、ストリーミングモデルは動くオブジェクトに影響され、アーティファクトやドリフトを引き起こす可能性がある。
本研究では,動的シーン再構成のためのトレーニングフリーストリーミングフレームワークRayMap3Rを提案する。
我々は、レイマップに基づく予測が静的シーンバイアスを示し、動的識別のための内部キューを提供するのを観察する。
この観測に基づいて、レイマップと画像予測を対比して動的領域を識別し、メモリ更新時の干渉を抑えるデュアルブランチ推論方式を構築する。
さらに,パラメータの整合性を保ち,予測軌道の安定化を図るために,リセット距離アライメントと状態認識平滑化を導入する。
提案手法は,複数のベンチマークを用いた動的シーン再構成におけるストリーミング手法の最先端性能を実現する。
関連論文リスト
- St4RTrack: Simultaneous 4D Reconstruction and Tracking in the World [106.91539872943864]
St4RTrackは、RGB入力から世界座標フレーム内の動的ビデオコンテンツを同時に再構成し、追跡するフレームワークである。
静的および動的シーン幾何学の両方をキャプチャして、同じ世界において、同時に両方のポイントマップを予測する。
統合されたデータ駆動フレームワークの有効性と効率を実証し、世界フレームの再構築と追跡のための新しい広範囲なベンチマークを構築します。
論文 参考訳(メタデータ) (2025-04-17T17:55:58Z) - D$^2$USt3R: Enhancing 3D Reconstruction for Dynamic Scenes [54.886845755635754]
本研究は動的シーンにおける3次元再構成の課題に対処し,物体の動きが従来の3次元ポイントマップ回帰法の品質を劣化させる。
空間的側面と時間的側面の両方を明示的に組み込むことにより,提案した点マップに対する3次元密度対応のカプセル化に成功した。
論文 参考訳(メタデータ) (2025-04-08T17:59:50Z) - POMATO: Marrying Pointmap Matching with Temporal Motion for Dynamic 3D Reconstruction [53.19968902152528]
POMATOは時間運動と一致する点マップを結合して動的3次元再構成を実現するための統合フレームワークである。
具体的には,RGB画素を動的および静的の両方の領域から3次元ポイントマップにマッピングすることで,明示的なマッチング関係を学習する。
本稿では,複数の下流タスクにまたがる顕著な性能を示すことによって,提案したポイントマップマッチングと時間融合のパラダイムの有効性を示す。
論文 参考訳(メタデータ) (2025-04-08T05:33:13Z) - Dynamic Point Maps: A Versatile Representation for Dynamic 3D Reconstruction [56.32589034046427]
本研究では,ダイナミックポイントマップ(DPM)を導入し,モーションセグメンテーション,シーンフロー推定,3次元物体追跡,2次元対応などの4次元タスクをサポートする標準点マップを拡張した。
我々は,合成データと実データを組み合わせたDPM予測器を訓練し,映像深度予測,ダイナミックポイントクラウド再構成,3次元シーンフロー,オブジェクトポーズ追跡,最先端性能の達成など,様々なベンチマークで評価する。
論文 参考訳(メタデータ) (2025-03-20T16:41:50Z) - Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving [116.10577967146762]
マルチビュー画像シーケンスからフレーム単位のポイントマップを直接回帰するフレームワークであるDriv3Rを提案する。
我々は4次元フロー予測器を用いてシーン内の移動物体を識別し、これらの動的領域の再構築をより重視する。
Driv3Rは4D動的シーン再構築において従来のフレームワークより優れており、推論速度は15倍高速である。
論文 参考訳(メタデータ) (2024-12-09T18:58:03Z) - Dynamic Semantic Occupancy Mapping using 3D Scene Flow and Closed-Form
Bayesian Inference [3.0389083199673337]
深層学習を用いた最新技術セマンティックセマンティックセグメンテーションと3次元フロー推定を利用して,マップ推論の計測を行う。
連続的な(すなわち任意の解像度でクエリできる)ベイズモデルを開発し、フローでシーンを伝播し、静的なモデルよりも優れた性能で3次元意味的占有マップを推論する。
論文 参考訳(メタデータ) (2021-08-06T15:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。