論文の概要: PROFusion: Robust and Accurate Dense Reconstruction via Camera Pose Regression and Optimization
- arxiv url: http://arxiv.org/abs/2509.24236v1
- Date: Mon, 29 Sep 2025 03:20:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.720489
- Title: PROFusion: Robust and Accurate Dense Reconstruction via Camera Pose Regression and Optimization
- Title(参考訳): Profusion:カメラポッド回帰と最適化によるロバストで高精度な高密度再構成
- Authors: Siyan Dong, Zijun Wang, Lulu Cai, Yi Ma, Yanchao Yang,
- Abstract要約: リアルタイムの密集したシーン再構築はロボティクスにとって不可欠である。
現在のRGB-D SLAMシステムは、カメラが大きな視点の変化、速い動き、突然の揺れを経験したときに失敗する。
- 参考スコア(独自算出の注目度): 21.23419310544054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time dense scene reconstruction during unstable camera motions is crucial for robotics, yet current RGB-D SLAM systems fail when cameras experience large viewpoint changes, fast motions, or sudden shaking. Classical optimization-based methods deliver high accuracy but fail with poor initialization during large motions, while learning-based approaches provide robustness but lack sufficient accuracy for dense reconstruction. We address this challenge through a combination of learning-based initialization with optimization-based refinement. Our method employs a camera pose regression network to predict metric-aware relative poses from consecutive RGB-D frames, which serve as reliable starting points for a randomized optimization algorithm that further aligns depth images with the scene geometry. Extensive experiments demonstrate promising results: our approach outperforms the best competitor on challenging benchmarks, while maintaining comparable accuracy on stable motion sequences. The system operates in real-time, showcasing that combining simple and principled techniques can achieve both robustness for unstable motions and accuracy for dense reconstruction. Project page: https://github.com/siyandong/PROFusion.
- Abstract(参考訳): しかし、現在のRGB-D SLAMシステムは、カメラに大きな視点の変化、速い動き、あるいは突然の揺れを経験すると失敗する。
古典的最適化に基づく手法は高い精度を提供するが、大きな動きの間に初期化が不十分な場合に失敗する。
学習に基づく初期化と最適化に基づく改良を組み合わせることで,この問題に対処する。
提案手法では,カメラポーズ回帰ネットワークを用いて連続RGB-Dフレームから距離認識された相対的なポーズを予測する。
我々の手法は、安定した動作シーケンスで同等の精度を維持しながら、挑戦的なベンチマークで最高の競争力を発揮する。
システムはリアルタイムに動作し、単純な技術と原則を組み合わせれば不安定な動きに対する頑健さと高密度な復元のための精度を両立させることができることを示した。
プロジェクトページ: https://github.com/siyandong/PROFusion.com
関連論文リスト
- UPGS: Unified Pose-aware Gaussian Splatting for Dynamic Scene Deblurring [31.35713139629235]
モノクロ映像から3Dシーンを再構成することは、カメラや物体の動きによる激しい動きのぼけによってしばしば失敗する。
学習可能なパラメータとしてカメラポーズを組み込むことにより、統一的な最適化フレームワークを導入する。
提案手法は, 従来の動的デブロアリング法に比べて, 復元品質が大きく向上し, 推定精度が向上する。
論文 参考訳(メタデータ) (2025-08-31T13:01:03Z) - GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering [54.489285024494855]
ビデオの安定化は、元のユーザの動きの意図を保ちながら、望ましくないシャキネスを除去するので、ビデオ処理に欠かせない。
既存のアプローチは、運用するドメインによって、ユーザエクスペリエンスを低下させるいくつかの問題に悩まされます。
ビデオの安定化を時間的に一貫性のある局所的再構成とレンダリングのパラダイムとして再構成する,新しい3Dグラウンドアプローチである textbfGaVS を紹介する。
論文 参考訳(メタデータ) (2025-06-30T15:24:27Z) - Towards Initialization-free Calibrated Bundle Adjustment [8.698137120086065]
本稿では、既知のカメラキャリブレーションを利用して、近距離距離の解を生成できる手法を提案する。
本手法は,pOSEフレームワークに回転平均化を組み込むことが可能である。
論文 参考訳(メタデータ) (2025-06-30T12:55:44Z) - 3R-GS: Best Practice in Optimizing Camera Poses Along with 3DGS [36.48425755917156]
3D Gaussian Splatting (3DGS)はその効率と品質でニューラルレンダリングに革命をもたらした。
これはStructure-from-Motion (SfM)システムからの正確なカメラのポーズに大きく依存する。
このギャップを埋める3Dガウススプレイティングフレームワークである3R-GSを提案する。
論文 参考訳(メタデータ) (2025-04-05T22:31:08Z) - XR-VIO: High-precision Visual Inertial Odometry with Fast Initialization for XR Applications [34.2082611110639]
本稿では,視覚慣性オドメトリー(VIO)に対する新しいアプローチとして,初期化と特徴マッチングモジュールについて述べる。
ジャイロスコープの既存の方法は、運動からの視覚構造(SfM)の安定性の低下や、膨大な数のパラメータの同時解決に悩まされることが多い。
測定値の密結合により,視覚的SfMの堅牢性と精度が向上する。
特徴マッチングに関しては,光学フローとディスクリプタベースマッチングを組み合わせたハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2025-02-03T12:17:51Z) - InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.77050739918037]
InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。
InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。
3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文 参考訳(メタデータ) (2024-03-29T17:29:58Z) - ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving
Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。
不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。
MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文 参考訳(メタデータ) (2022-07-19T09:19:45Z) - Asynchronous Optimisation for Event-based Visual Odometry [53.59879499700895]
イベントカメラは、低レイテンシと高ダイナミックレンジのために、ロボット知覚の新しい可能性を開く。
イベントベースビジュアル・オドメトリー(VO)に焦点をあてる
動作最適化のバックエンドとして非同期構造を提案する。
論文 参考訳(メタデータ) (2022-03-02T11:28:47Z) - Learning-Based Framework for Camera Calibration with Distortion
Correction and High Precision Feature Detection [14.297068346634351]
本稿では,これらのボトルネックに対処する従来の手法と学習に基づくアプローチを組み合わせたハイブリッドカメラキャリブレーションフレームワークを提案する。
特に、このフレームワークは学習に基づくアプローチを利用して、効率的な歪み補正とロバストなチェス盤角座標符号化を行う。
広範に使われている2つのカメラキャリブレーションツールボックスと比較して、実データと合成データの両方の実験結果は、提案フレームワークのより良い堅牢性と高い精度を示す。
論文 参考訳(メタデータ) (2022-02-01T00:19:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。