論文の概要: MARVO: Marine-Adaptive Radiance-aware Visual Odometry
- arxiv url: http://arxiv.org/abs/2511.22860v1
- Date: Fri, 28 Nov 2025 03:31:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.757273
- Title: MARVO: Marine-Adaptive Radiance-aware Visual Odometry
- Title(参考訳): MARVO: 海洋適応型放射能認識型視覚オドメトリー
- Authors: Sacchin Sundar, Atman Kikani, Aaliya Alam, Sumukh Shrote, A. Nayeemulla Khan, A. Shahina,
- Abstract要約: MARVOは,水中画像形成モデル,識別可能なマッチング,強化学習を融合した物理認識・学習統合化フレームワークである。
強化に基づく PoseGraph は、SE(2) 上の最適リトラクション作用を学習することにより、古典的最小二乗の局所ミニマを超えてグローバルなトラジェクトリを洗練する。
- 参考スコア(独自算出の注目度): 0.5336398444466023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underwater visual localization remains challenging due to wavelength-dependent attenuation, poor texture, and non-Gaussian sensor noise. We introduce MARVO, a physics-aware, learning-integrated odometry framework that fuses underwater image formation modeling, differentiable matching, and reinforcement-learning optimization. At the front-end, we extend transformer-based feature matcher with a Physics Aware Radiance Adapter that compensates for color channel attenuation and contrast loss, yielding geometrically consistent feature correspondences under turbidity. These semi dense matches are combined with inertial and pressure measurements inside a factor-graph backend, where we formulate a keyframe-based visual-inertial-barometric estimator using GTSAM library. Each keyframe introduces (i) Pre-integrated IMU motion factors, (ii) MARVO-derived visual pose factors, and (iii) barometric depth priors, giving a full-state MAP estimate in real time. Lastly, we introduce a Reinforcement-Learningbased Pose-Graph Optimizer that refines global trajectories beyond local minima of classical least-squares solvers by learning optimal retraction actions on SE(2).
- Abstract(参考訳): 水中での視覚的局所化は、波長依存性の減衰、質感の低下、非ガウスセンサノイズのために依然として困難である。
MARVOは,水中画像形成モデル,識別可能なマッチング,強化学習最適化を融合した物理認識型,学習統合型オドメトリーフレームワークである。
フロントエンドでは、色チャネル減衰とコントラスト損失を補償する物理Aware Radiance Adapterを用いてトランスフォーマーベースの特徴マッチングを拡張し、幾何的に一貫した特徴対応を与える。
これらの半密マッチングは、GTSAMライブラリを用いてキーフレームベースの視覚慣性・気圧推定器を定式化する因子グラフバックエンド内の慣性・圧力測定と組み合わせられる。
各キーフレームの導入
i) 予め統合したIMU運動因子
(II)MARVO由来の視覚的ポーズ因子、及び
(iii) 実時間で全状態MAP推定値を与える、バロメトリの深さの先行値。
最後に,SE(2)上での最適リトラクション動作の学習により,古典的最小二乗解法の局所的ミニマを超えてグローバルなトラジェクトリを洗練する強化学習型Pose-Graphオプティマイザを提案する。
関連論文リスト
- S2ML: Spatio-Spectral Mutual Learning for Depth Completion [56.26679539288063]
RGB-Dカメラで撮影した生深度画像は、弱い反射、境界影、アーティファクトによって不完全な深度値に悩まされることが多い。
既存の手法では、画像領域の深度補完によってこの問題に対処するが、それらは生の深度画像の物理的特性を見落としている。
本研究では,空間領域と周波数領域の両方の利点を両立させるため,S2ML(Spatio-Spectral Mutual Learning framework)を提案する。
論文 参考訳(メタデータ) (2025-11-08T15:01:55Z) - SPORTS: Simultaneous Panoptic Odometry, Rendering, Tracking and Segmentation for Urban Scenes Understanding [0.0]
本稿では,全体像理解のための新しいフレームワーク SPORTS を提案する。
Video Panoptic (VPS)、Visual Odometry (VO)、Scene Renderingタスクを反復的で統一された視点に統合する。
我々の注意に基づく特徴融合は、計測、追跡、セグメンテーション、新しいビュータスクにおいて、既存の最先端の合成方法よりも優れています。
論文 参考訳(メタデータ) (2025-10-14T17:28:19Z) - MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.158063913401575]
フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。
実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。
我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2025-09-25T05:26:28Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - RD-VIO: Robust Visual-Inertial Odometry for Mobile Augmented Reality in
Dynamic Environments [55.864869961717424]
視覚的・視覚的慣性オドメトリーシステムでは、動的シーンや純粋な回転の問題に対処することが通常困難である。
我々はこれらの問題に対処するためにRD-VIOと呼ばれる新しい視覚-慣性オドメトリーシステム(VIO)を設計する。
論文 参考訳(メタデータ) (2023-10-23T16:30:39Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - A Look at Improving Robustness in Visual-inertial SLAM by Moment
Matching [17.995121900076615]
本稿では,拡張カルマンフィルタ(EKF)がもたらす実用的意味と限界について批判的な考察を行う。
我々は,視覚-慣性計測と視覚SLAMの両方にモーメントマッチング(未開のカルマンフィルタリング)アプローチを採用する。
論文 参考訳(メタデータ) (2022-05-27T08:22:03Z) - Early Bird: Loop Closures from Opposing Viewpoints for
Perceptually-Aliased Indoor Environments [35.663671249819124]
本稿では,視点変化と知覚的エイリアスを同時に扱う新しい研究を提案する。
本稿では,VPRとSLAMの統合により,VPRの性能向上,特徴対応,グラフサブモジュールのポーズが著しく促進されることを示す。
知覚的エイリアス化や180度回転する極端な視点変化に拘わらず,最先端のパフォーマンスを実現するローカライズシステムについて初めて紹介する。
論文 参考訳(メタデータ) (2020-10-03T20:18:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。