論文の概要: MVTD: A Benchmark Dataset for Maritime Visual Object Tracking
- arxiv url: http://arxiv.org/abs/2506.02866v1
- Date: Tue, 03 Jun 2025 13:30:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.708822
- Title: MVTD: A Benchmark Dataset for Maritime Visual Object Tracking
- Title(参考訳): MVTD: 海中ビジュアルオブジェクト追跡のためのベンチマークデータセット
- Authors: Ahsan Baidar Bakht, Muhayy Ud Din, Sajid Javed, Irfan Hussain,
- Abstract要約: 海中視覚追跡データセット(MVTD)は182の高解像度ビデオシーケンスで構成され、合計で15万フレームである。
MVTDは、海洋環境の現実的な複雑さを反映して、さまざまな運用状況と海洋シナリオをキャプチャする。
MVTDベンチマークで14種類のSOTA追跡アルゴリズムを評価し, 汎用データセットの性能と比較すると, 大幅な性能劣化が見られた。
- 参考スコア(独自算出の注目度): 4.956066467858057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Object Tracking (VOT) is a fundamental task with widespread applications in autonomous navigation, surveillance, and maritime robotics. Despite significant advances in generic object tracking, maritime environments continue to present unique challenges, including specular water reflections, low-contrast targets, dynamically changing backgrounds, and frequent occlusions. These complexities significantly degrade the performance of state-of-the-art tracking algorithms, highlighting the need for domain-specific datasets. To address this gap, we introduce the Maritime Visual Tracking Dataset (MVTD), a comprehensive and publicly available benchmark specifically designed for maritime VOT. MVTD comprises 182 high-resolution video sequences, totaling approximately 150,000 frames, and includes four representative object classes: boat, ship, sailboat, and unmanned surface vehicle (USV). The dataset captures a diverse range of operational conditions and maritime scenarios, reflecting the real-world complexities of maritime environments. We evaluated 14 recent SOTA tracking algorithms on the MVTD benchmark and observed substantial performance degradation compared to their performance on general-purpose datasets. However, when fine-tuned on MVTD, these models demonstrate significant performance gains, underscoring the effectiveness of domain adaptation and the importance of transfer learning in specialized tracking contexts. The MVTD dataset fills a critical gap in the visual tracking community by providing a realistic and challenging benchmark for maritime scenarios. Dataset and Source Code can be accessed here "https://github.com/AhsanBaidar/MVTD".
- Abstract(参考訳): ビジュアルオブジェクト追跡(VOT)は、自律ナビゲーション、監視、海洋ロボット工学の幅広い応用における基本的なタスクである。
一般的な物体追跡の大幅な進歩にもかかわらず、海洋環境は、特異な水反射、低コントラストターゲット、動的に変化する背景、頻繁な閉塞など、独特な課題を呈し続けている。
これらの複雑さは最先端のトラッキングアルゴリズムのパフォーマンスを著しく低下させ、ドメイン固有のデータセットの必要性を強調している。
このギャップに対処するために、海洋VOT用に特別に設計された包括的かつ一般公開されたベンチマークである、海洋視覚追跡データセット(MVTD)を紹介します。
MVTDは182の高解像度ビデオシーケンスで構成され、合計で約15万フレームを有し、ボート、船、ヨット、無人表面車両(USV)の4つの代表的なオブジェクトクラスを含んでいる。
データセットは、海洋環境の現実的な複雑さを反映して、さまざまな運用状況と海洋シナリオをキャプチャする。
MVTDベンチマークで14種類のSOTA追跡アルゴリズムを評価し, 汎用データセットの性能と比較すると, 大幅な性能劣化が見られた。
しかし、MVTDを微調整すると、これらのモデルは、ドメイン適応の有効性と、特殊なトラッキングコンテキストにおける伝達学習の重要性を強調して、大幅な性能向上を示す。
MVTDデータセットは、海上シナリオの現実的で挑戦的なベンチマークを提供することで、ビジュアルトラッキングコミュニティにおける重要なギャップを埋めます。
DatasetとSource Codeは、"https://github.com/AhsanBaidar/MVTD"でアクセスできる。
関連論文リスト
- MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文 参考訳(メタデータ) (2024-12-08T09:34:23Z) - Underwater Camouflaged Object Tracking Meets Vision-Language SAM2 [60.47622353256502]
本研究は,UW-COT220という大規模水中カモフラージュ型物体追跡データセットを提案する。
提案したデータセットに基づいて、本研究はまず、水中環境に挑戦するSAMとSAM2ベースのトラッカーを含む、現在の高度な視覚オブジェクト追跡手法を評価する。
本研究はSAM2よりもSAM2を改良し,水中カモフラージュ物体の複雑度を処理できることを実証した。
論文 参考訳(メタデータ) (2024-09-25T13:10:03Z) - Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.468621550644668]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している
海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。
既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文 参考訳(メタデータ) (2024-07-12T05:48:53Z) - Improving Underwater Visual Tracking With a Large Scale Dataset and
Image Enhancement [70.2429155741593]
本稿では,水中ビジュアルオブジェクト追跡(UVOT)のための新しいデータセットと汎用トラッカ拡張手法を提案する。
水中環境は、一様でない照明条件、視界の低さ、鋭さの欠如、コントラストの低さ、カモフラージュ、懸濁粒子からの反射を示す。
本研究では,追尾品質の向上に特化して設計された水中画像強調アルゴリズムを提案する。
この手法により、最先端(SOTA)ビジュアルトラッカーの最大5.0%のAUCの性能が向上した。
論文 参考訳(メタデータ) (2023-08-30T07:41:26Z) - Vision-Based Autonomous Navigation for Unmanned Surface Vessel in
Extreme Marine Conditions [2.8983738640808645]
本稿では,極端海洋環境下での目標物追跡のための自律的視覚に基づくナビゲーション・フレームワークを提案する。
提案手法は砂嵐や霧による可視性低下下でのシミュレーションで徹底的に検証されている。
結果は、ベンチマークしたMBZIRCシミュレーションデータセット全体にわたる最先端のデハージング手法と比較される。
論文 参考訳(メタデータ) (2023-08-08T14:25:13Z) - AVisT: A Benchmark for Visual Object Tracking in Adverse Visibility [125.77396380698639]
AVisTは、視認性の悪いさまざまなシナリオにおける視覚的トラッキングのためのベンチマークである。
AVisTは、80kの注釈付きフレームを持つ120の挑戦的なシーケンスで構成されており、18の多様なシナリオにまたがっている。
我々は、属性間でのトラッキング性能を詳細に分析し、AVisTで17の人気のトラッカーと最近のトラッカーをベンチマークした。
論文 参考訳(メタデータ) (2022-08-14T17:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。