論文の概要: MANTA: Physics-Informed Generalized Underwater Object Tracking
- arxiv url: http://arxiv.org/abs/2511.23405v1
- Date: Fri, 28 Nov 2025 17:59:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:56.013389
- Title: MANTA: Physics-Informed Generalized Underwater Object Tracking
- Title(参考訳): MANTA:物理式汎用水中物体追跡
- Authors: Suhas Srinath, Hemang Jamadagni, Aditya Chadrasekar, Prathosh AP,
- Abstract要約: 本稿では,表現学習と水中シナリオの追跡設計を統合した物理インフォームフレームワークMANTAを提案する。
MANTAは最先端のパフォーマンスを実現し、Success AUCを最大6%改善し、安定した長期汎用水中追跡と効率的な実行環境を確保している。
- 参考スコア(独自算出の注目度): 7.246898300861601
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Underwater object tracking is challenging due to wavelength dependent attenuation and scattering, which severely distort appearance across depths and water conditions. Existing trackers trained on terrestrial data fail to generalize to these physics-driven degradations. We present MANTA, a physics-informed framework integrating representation learning with tracking design for underwater scenarios. We propose a dual-positive contrastive learning strategy coupling temporal consistency with Beer-Lambert augmentations to yield features robust to both temporal and underwater distortions. We further introduce a multi-stage pipeline augmenting motion-based tracking with a physics-informed secondary association algorithm that integrates geometric consistency and appearance similarity for re-identification under occlusion and drift. To complement standard IoU metrics, we propose Center-Scale Consistency (CSC) and Geometric Alignment Score (GAS) to assess geometric fidelity. Experiments on four underwater benchmarks (WebUOT-1M, UOT32, UTB180, UWCOT220) show that MANTA achieves state-of-the-art performance, improving Success AUC by up to 6 percent, while ensuring stable long-term generalized underwater tracking and efficient runtime.
- Abstract(参考訳): 水中物体の追跡は、波長依存性の減衰と散乱により困難であり、深度や水環境をまたいだ外観が著しく歪んでいる。
地上データに基づいて訓練された既存のトラッカーは、これらの物理駆動の劣化を一般化することができない。
本稿では,表現学習と水中シナリオの追跡設計を統合した物理インフォームフレームワークMANTAを提案する。
本研究では, 時間的および水中の歪みに頑健な特徴を与えるため, 時間的整合性をBeer-Lambert拡張と結合する二重正差学習戦略を提案する。
さらに、物理インフォームドセカンダリアソシエーションアルゴリズムを用いて動きに基づくトラッキングを増強する多段階パイプラインを導入し、幾何的整合性と外観類似性を統合し、オクルージョンとドリフトの下での再同定を行う。
標準IoUメトリクスを補完するため、幾何学的忠実度を評価するためにCSC(Central-Scale Consistency)とGAS(Geometric Alignment Score)を提案する。
4つの水中ベンチマーク(WebUOT-1M, UOT32, UTB180, UWCOT220)の実験では、MANTAは最先端の性能を達成し、成功AUCを最大6%改善し、長期間の一般的な水中追跡と効率的な実行環境を確保した。
関連論文リスト
- MARVO: Marine-Adaptive Radiance-aware Visual Odometry [0.5336398444466023]
MARVOは,水中画像形成モデル,識別可能なマッチング,強化学習を融合した物理認識・学習統合化フレームワークである。
強化に基づく PoseGraph は、SE(2) 上の最適リトラクション作用を学習することにより、古典的最小二乗の局所ミニマを超えてグローバルなトラジェクトリを洗練する。
論文 参考訳(メタデータ) (2025-11-28T03:31:40Z) - HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.07224739976911]
イベントカメラは例外的な時間分解能と範囲(モード)を提供する
RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文 参考訳(メタデータ) (2025-10-22T13:15:13Z) - Underwater Monocular Metric Depth Estimation: Real-World Benchmarks and Synthetic Fine-Tuning with Vision Foundation Models [0.0]
実世界の水中データセットを用いたゼロショットおよび微調整単分子メートル法深度推定モデルのベンチマークを示す。
その結果,地上データ(実データや合成データ)に基づいて訓練した大規模モデルでは,水中での作業は不十分であることがわかった。
本研究では,水中における単分子距離深度推定の詳細な評価と可視化を行う。
論文 参考訳(メタデータ) (2025-07-02T21:06:39Z) - Physics Informed Capsule Enhanced Variational AutoEncoder for Underwater Image Enhancement [8.16306466526838]
本稿では,最先端の水中画像強調を実現する新しいデュアルストリームアーキテクチャを提案する。
本手法は,専用物理推定器による送信マップと背景光の空間変化を同時に推定する。
提案手法は,複数の空間周波数にまたがる物理的定着と知覚的品質の両立を保証する新しい最適化目標も備えている。
論文 参考訳(メタデータ) (2025-06-05T08:39:17Z) - Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。
従来の研究は、濁度や後方散乱に適応する手法を導入してきた。
本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-23T06:48:38Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - An Efficient Detection and Control System for Underwater Docking using
Machine Learning and Realistic Simulation: A Comprehensive Approach [5.039813366558306]
この研究は、水中ドッキングの検出と分類を行うために異なるディープラーニングアーキテクチャと比較する。
GAN(Generative Adversarial Network)は画像から画像への変換に用いられ、ガゼボのシミュレーション画像を水中画像に変換する。
その結果,水中の潮流によらず,高濁度シナリオでは20%の改善が見られた。
論文 参考訳(メタデータ) (2023-11-02T18:10:20Z) - SM/VIO: Robust Underwater State Estimation Switching Between Model-based
and Visual Inertial Odometry [1.9785872350085876]
本稿では,水中操作における視覚慣性状態推定のロバスト性問題に対処する。
提案手法では,ロボットの運動学モデルと固有感覚センサを用いてポーズ推定を行う。
ヘルスモニタリングは、2つの推定器間のタイムリーな切り替えを保証するVIOプロセスを追跡する。
論文 参考訳(メタデータ) (2023-04-04T17:46:20Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - Towards Scale-Aware, Robust, and Generalizable Unsupervised Monocular
Depth Estimation by Integrating IMU Motion Dynamics [74.1720528573331]
教師なし単眼深度と自我運動推定は近年広く研究されている。
我々は、視覚情報とIMUモーションダイナミクスを統合した新しいスケールアウェアフレームワークDynaDepthを提案する。
我々は、KITTIおよびMake3Dデータセット上で広範囲な実験とシミュレーションを行うことにより、DynaDepthの有効性を検証する。
論文 参考訳(メタデータ) (2022-07-11T07:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。