論文の概要: MMOT: The First Challenging Benchmark for Drone-based Multispectral Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2510.12565v1
- Date: Tue, 14 Oct 2025 14:25:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.351069
- Title: MMOT: The First Challenging Benchmark for Drone-based Multispectral Multi-Object Tracking
- Title(参考訳): MMOT:ドローンによるマルチスペクトルマルチオブジェクト追跡のための最初のベンチマーク
- Authors: Tianhao Li, Tingfa Xu, Ying Wang, Haolin Qin, Xu Lin, Jianan Li,
- Abstract要約: MMOTは、ドローンベースのマルチスペクトルマルチオブジェクトトラッキングのための最初のベンチマークである。
125の動画シーケンスと8つのカテゴリにわたる488.8Kアノテーションがある。
スペクトル特徴の抽出と指向アノテーションの活用のために,マルチスペクトルおよび指向性を考慮したMOT方式を提案する。
- 参考スコア(独自算出の注目度): 30.3437683353074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Drone-based multi-object tracking is essential yet highly challenging due to small targets, severe occlusions, and cluttered backgrounds. Existing RGB-based tracking algorithms heavily depend on spatial appearance cues such as color and texture, which often degrade in aerial views, compromising reliability. Multispectral imagery, capturing pixel-level spectral reflectance, provides crucial cues that enhance object discriminability under degraded spatial conditions. However, the lack of dedicated multispectral UAV datasets has hindered progress in this domain. To bridge this gap, we introduce MMOT, the first challenging benchmark for drone-based multispectral multi-object tracking. It features three key characteristics: (i) Large Scale - 125 video sequences with over 488.8K annotations across eight categories; (ii) Comprehensive Challenges - covering diverse conditions such as extreme small targets, high-density scenarios, severe occlusions, and complex motion; and (iii) Precise Oriented Annotations - enabling accurate localization and reduced ambiguity under aerial perspectives. To better extract spectral features and leverage oriented annotations, we further present a multispectral and orientation-aware MOT scheme adapting existing methods, featuring: (i) a lightweight Spectral 3D-Stem integrating spectral features while preserving compatibility with RGB pretraining; (ii) an orientation-aware Kalman filter for precise state estimation; and (iii) an end-to-end orientation-adaptive transformer. Extensive experiments across representative trackers consistently show that multispectral input markedly improves tracking performance over RGB baselines, particularly for small and densely packed objects. We believe our work will advance drone-based multispectral multi-object tracking research. Our MMOT, code, and benchmarks are publicly available at https://github.com/Annzstbl/MMOT.
- Abstract(参考訳): ドローンベースのマルチオブジェクトトラッキングは、小さなターゲット、厳しい閉塞、散らかった背景のために不可欠だが、非常に難しい。
既存のRGBベースのトラッキングアルゴリズムは、色やテクスチャなどの空間的な外観に大きく依存している。
画素レベルの分光反射を捉えたマルチスペクトル画像は、劣化した空間条件下での物体の識別性を高める重要な手がかりを提供する。
しかし、専用の多スペクトルUAVデータセットの欠如は、この領域の進歩を妨げている。
このギャップを埋めるために、ドローンベースのマルチスペクトルマルチオブジェクトトラッキングのための最初の挑戦的なベンチマークであるMMOTを導入する。
主な特徴は3つある。
(i)8つのカテゴリにまたがる488.8Kアノテーションを含む125の動画シーケンス。
(二)包括的課題-極端に小さな目標、高密度シナリオ、重度の閉塞、複雑な動きなど多様な条件をカバーし、
三 精密オリエンテーションアノテーション 正確な位置決めを可能にし、航空視界におけるあいまいさを低減すること。
スペクトルの特徴を抽出し、オブジェクト指向アノテーションを活用するため、既存の手法に適応した多スペクトル・向き対応MOTスキームをさらに提示する。
(i)RGB事前学習との互換性を維持しつつ、スペクトル機能を統合した軽量なスペクトル3Dステム
(二)正確な状態推定のための配向対応カルマンフィルタ、及び
(iii)縦方向適応型変圧器。
代表トラッカー間の大規模な実験により、マルチスペクトル入力はRGBベースライン、特に小型で高密度のオブジェクトに対するトラッキング性能を著しく向上することが示された。
われわれは、ドローンによるマルチスペクトル多対象追跡研究を前進させると信じている。
私たちのMMOT、コード、ベンチマークはhttps://github.com/Annzstbl/MMOT.comで公開されています。
関連論文リスト
- MSITrack: A Challenging Benchmark for Multispectral Single Object Tracking [28.794206918661818]
MSITrackは、これまでで最大かつ最も多様なマルチスペクトル単一オブジェクト追跡データセットである。
55のカテゴリーと300の異なる自然のシーンがある。
MSITrackは、RGBのみのベースラインよりもパフォーマンスが大幅に向上する。
論文 参考訳(メタデータ) (2025-10-08T03:56:36Z) - Collaborating Vision, Depth, and Thermal Signals for Multi-Modal Tracking: Dataset and Algorithm [103.36490810025752]
本研究は、可視RGB、深度(D)、熱赤外(TIR)を含む3つの相補的なモードを利用する、新しいマルチモーダルトラッキングタスクを導入する。
我々はRDTTrackと呼ばれる新しいマルチモーダルトラッカーを提案する。これは、事前訓練されたRGBのみの追跡モデルと迅速な学習技術を活用して、ロバストなトラッキングのためのトリモーダル情報を統合する。
実験の結果,提案手法の有効性と利点を実証し,既存のデュアルモーダル手法に対して有意な改善が認められた。
論文 参考訳(メタデータ) (2025-09-29T13:05:15Z) - MCOD: The First Challenging Benchmark for Multispectral Camouflaged Object Detection [26.760763912987795]
Camouflaged Object Detection (COD)は、自然界にシームレスに溶け込む物体を識別することを目的としている。
既存のCODベンチマークデータセットはRGBベースであり、マルチスペクトルアプローチに不可欠なサポートがない。
マルチスペクトルカモフラージュオブジェクト検出のために特別に設計された、最初の挑戦的なベンチマークデータセットであるMCODを紹介する。
論文 参考訳(メタデータ) (2025-09-19T08:29:33Z) - DEPFusion: Dual-Domain Enhancement and Priority-Guided Mamba Fusion for UAV Multispectral Object Detection [6.4402018224356015]
DEPFusionというフレームワークがUAVマルチスペクトル物体検出のために提案されている。
デュアルドメイン強化(DDE)と優先誘導マンバ核融合(PGMF)から構成される。
DroneVehicleとVEDAIデータセットの実験は、DEPFusionが最先端の手法で優れたパフォーマンスを達成することを実証している。
論文 参考訳(メタデータ) (2025-09-09T01:51:57Z) - GRASPTrack: Geometry-Reasoned Association via Segmentation and Projection for Multi-Object Tracking [11.436294975354556]
GRASPTrackはモノクロ深度推定とインスタンスセグメンテーションを標準TBDパイプラインに統合する新しいMOTフレームワークである。
これらの3D点雲は、精密で堅牢なVoxel-based 3D Intersection-over-Unionを可能にするために酸化される。
論文 参考訳(メタデータ) (2025-08-11T15:56:21Z) - Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。
既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。
本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文 参考訳(メタデータ) (2025-08-03T12:06:47Z) - MUST: The First Dataset and Unified Framework for Multispectral UAV Single Object Tracking [17.96400810834486]
第1回大規模マルチスペクトルUAVシングルオブジェクト追跡データセット(MUST)について紹介する。
MUSTには、様々な環境と課題にまたがる250のビデオシーケンスが含まれている。
また,スペクトルプロンプトからのスペクトル,空間,時間的特徴をエンコードする新しい追跡フレームワークUNTrackを提案する。
論文 参考訳(メタデータ) (2025-03-22T08:47:28Z) - SpectralGPT: Spectral Remote Sensing Foundation Model [60.023956954916414]
SpectralGPTという名前のユニバーサルRS基盤モデルは、新しい3D生成事前学習変換器(GPT)を用いてスペクトルRS画像を処理するために構築されている。
既存の基礎モデルと比較して、SpectralGPTは、様々なサイズ、解像度、時系列、領域をプログレッシブトレーニング形式で対応し、広範なRSビッグデータのフル活用を可能にする。
我々の評価では、事前訓練されたスペクトルGPTモデルによる顕著な性能向上が強調され、地球科学分野におけるスペクトルRSビッグデータ応用の進展に有意な可能性を示唆している。
論文 参考訳(メタデータ) (2023-11-13T07:09:30Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。