論文の概要: Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline
- arxiv url: http://arxiv.org/abs/2204.04120v1
- Date: Fri, 8 Apr 2022 15:22:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-11 13:06:57.591171
- Title: Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline
- Title(参考訳): Visible-Thermal UAV Tracking:大規模ベンチマークと新しいベースライン
- Authors: Pengyu Zhang, Jie Zhao, Dong Wang, Huchuan Lu, Xiang Ruan
- Abstract要約: 本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
- 参考スコア(独自算出の注目度): 80.13652104204691
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the popularity of multi-modal sensors, visible-thermal (RGB-T) object
tracking is to achieve robust performance and wider application scenarios with
the guidance of objects' temperature information. However, the lack of paired
training samples is the main bottleneck for unlocking the power of RGB-T
tracking. Since it is laborious to collect high-quality RGB-T sequences, recent
benchmarks only provide test sequences. In this paper, we construct a
large-scale benchmark with high diversity for visible-thermal UAV tracking
(VTUAV), including 500 sequences with 1.7 million high-resolution (1920
$\times$ 1080 pixels) frame pairs. In addition, comprehensive applications
(short-term tracking, long-term tracking and segmentation mask prediction) with
diverse categories and scenes are considered for exhaustive evaluation.
Moreover, we provide a coarse-to-fine attribute annotation, where frame-level
attributes are provided to exploit the potential of challenge-specific
trackers. In addition, we design a new RGB-T baseline, named Hierarchical
Multi-modal Fusion Tracker (HMFT), which fuses RGB-T data in various levels.
Numerous experiments on several datasets are conducted to reveal the
effectiveness of HMFT and the complement of different fusion types. The project
is available at here.
- Abstract(参考訳): マルチモーダルセンサの普及に伴い、可視熱量(RGB-T)オブジェクトトラッキングは、オブジェクトの温度情報のガイダンスを用いて、堅牢なパフォーマンスとより広いアプリケーションシナリオを実現する。
しかし、ペアのトレーニングサンプルがないことが、RGB-Tトラッキングのパワーをアンロックする主なボトルネックとなっている。
高品質なRGB-Tシーケンスの収集には熱心であるため、最近のベンチマークはテストシーケンスのみを提供する。
本稿では,高解像度(1920$\times$1080 pixels)のフレーム対を持つ500のシーケンスを含む可視熱UAV追跡(VTUAV)の多様性の高い大規模ベンチマークを構築した。
さらに,多種多様なカテゴリやシーンを含む包括的アプリケーション(短期追跡,長期追跡,セグメンテーションマスク予測)を網羅的に評価する。
さらに,難解なトラッカーの可能性を活かすために,フレームレベルの属性を提供する粗い属性アノテーションを提供する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
いくつかのデータセットに対する多数の実験を行い、HMFTの有効性と異なる融合型の相補性を明らかにする。
このプロジェクトはここで入手できる。
関連論文リスト
- Visible-Thermal Multiple Object Tracking: Large-scale Video Dataset and Progressive Fusion Approach [17.286142856787222]
VT-MOTと呼ばれる多目的追跡(MOT)のための大規模な可視熱ビデオベンチマークに貢献する。
VT-MOTには、582のビデオシーケンスペア、401kフレームペアの監視、ドローン、ハンドヘルドプラットフォームが含まれている。
VT-MOTの総合的な実験を行い,提案手法の優位性と有効性を示した。
論文 参考訳(メタデータ) (2024-08-02T01:29:43Z) - SDSTrack: Self-Distillation Symmetric Adapter Learning for Multi-Modal Visual Object Tracking [19.50096632818305]
VOT(Multimodal Visual Object Tracking)は、その堅牢性により、最近大きな注目を集めている。
近年の研究では、事前訓練されたRGBベースのトラッカーをマルチモーダルデータに転送するために、プロンプトチューニングを利用している。
我々はSDSTrackと呼ばれる新しい対称マルチモーダルトラッキングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T04:15:50Z) - Long-term Frame-Event Visual Tracking: Benchmark Dataset and Baseline [37.06330707742272]
まず, FELTと呼ばれる, 長期的かつ大規模な単一オブジェクト追跡データセットを提案する。
742の動画と1,594,474のRGBフレームとイベントストリームペアが含まれており、これまでで最大のフレームイベント追跡データセットになっている。
本稿では,RGBとイベントデータの両方を融合させるために,現代的なホップフィールド層をマルチヘッド自己アテンションブロックに導入することで,統一バックボーンとして新しい連想メモリトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2024-03-09T08:49:50Z) - EANet: Enhanced Attribute-based RGBT Tracker Network [0.0]
RGBと熱画像(RGBT)を融合した深層学習に基づく画像追跡手法を提案する。
提案モデルは,特徴抽出器とトラッカーの2つの主成分から構成される。
提案手法はRGBT234 citeLiCLiang 2018とLasHeR citeLiLasher 2021データセットで評価される。
論文 参考訳(メタデータ) (2023-07-04T19:34:53Z) - Revisiting Color-Event based Tracking: A Unified Network, Dataset, and
Metric [53.88188265943762]
上記の機能を同時に実現したCEUTrack(Color-Event Unified Tracking)のためのシングルステージバックボーンネットワークを提案する。
提案するCEUTrackはシンプルで,効率的で,75FPS以上を達成し,新たなSOTA性能を実現している。
論文 参考訳(メタデータ) (2022-11-20T16:01:31Z) - AVisT: A Benchmark for Visual Object Tracking in Adverse Visibility [125.77396380698639]
AVisTは、視認性の悪いさまざまなシナリオにおける視覚的トラッキングのためのベンチマークである。
AVisTは、80kの注釈付きフレームを持つ120の挑戦的なシーケンスで構成されており、18の多様なシナリオにまたがっている。
我々は、属性間でのトラッキング性能を詳細に分析し、AVisTで17の人気のトラッカーと最近のトラッカーをベンチマークした。
論文 参考訳(メタデータ) (2022-08-14T17:49:37Z) - Temporal Aggregation for Adaptive RGBT Tracking [14.00078027541162]
本稿では,頑健な外見モデル学習を考慮したRGBTトラッカーを提案する。
空間情報のみを含むオブジェクト追跡タスクを実装している既存のRGBTトラッカーとは異なり、この手法では時間情報も考慮されている。
論文 参考訳(メタデータ) (2022-01-22T02:31:56Z) - Multi-modal Visual Tracking: Review and Experimental Comparison [85.20414397784937]
マルチモーダルトラッキングアルゴリズム,特に可視深度(RGB-D)と可視温度(RGB-T)を要約する。
5つのデータセット上でトラッカーの有効性を分析する実験を行った。
論文 参考訳(メタデータ) (2020-12-08T02:39:38Z) - LSOTB-TIR:A Large-Scale High-Diversity Thermal Infrared Object Tracking
Benchmark [51.1506855334948]
本稿では、LSOTBTIRと呼ばれる、大規模かつ多種多様な熱赤外(TIR)オブジェクト追跡ベンチマークを提案する。
すべての列のすべてのフレームにおけるオブジェクトの有界ボックスに注釈を付け、合計で730K以上の有界ボックスを生成する。
我々は,LSOTB-TIR上で30以上のトラッカーを評価し解析し,一連のベースラインを提供することにより,ディープトラッカーが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2020-08-03T12:36:06Z) - Jointly Modeling Motion and Appearance Cues for Robust RGB-T Tracking [85.333260415532]
我々はRGBと熱(T)の両モードの融合重量マップを推定する新しい後期融合法を開発した。
外観キューが信頼できない場合には、動作キューを考慮に入れ、トラッカーを堅牢にする。
最近の3つのRGB-T追跡データセットの多くの結果から、提案したトラッカーは他の最先端のアルゴリズムよりも大幅に性能が向上していることが示された。
論文 参考訳(メタデータ) (2020-07-04T08:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。