論文の概要: LSOTB-TIR:A Large-Scale High-Diversity Thermal Infrared Object Tracking
Benchmark
- arxiv url: http://arxiv.org/abs/2008.00836v1
- Date: Mon, 3 Aug 2020 12:36:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 07:09:35.870579
- Title: LSOTB-TIR:A Large-Scale High-Diversity Thermal Infrared Object Tracking
Benchmark
- Title(参考訳): LSOTB-TIR:大規模熱赤外物体追跡ベンチマーク
- Authors: Qiao Liu, Xin Li, Zhenyu He, Chenglong Li, Jun Li, Zikun Zhou, Di
Yuan, Jing Li, Kai Yang, Nana Fan, Feng Zheng
- Abstract要約: 本稿では、LSOTBTIRと呼ばれる、大規模かつ多種多様な熱赤外(TIR)オブジェクト追跡ベンチマークを提案する。
すべての列のすべてのフレームにおけるオブジェクトの有界ボックスに注釈を付け、合計で730K以上の有界ボックスを生成する。
我々は,LSOTB-TIR上で30以上のトラッカーを評価し解析し,一連のベースラインを提供することにより,ディープトラッカーが有望な性能を達成することを示す。
- 参考スコア(独自算出の注目度): 51.1506855334948
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this paper, we present a Large-Scale and high-diversity general Thermal
InfraRed (TIR) Object Tracking Benchmark, called LSOTBTIR, which consists of an
evaluation dataset and a training dataset with a total of 1,400 TIR sequences
and more than 600K frames. We annotate the bounding box of objects in every
frame of all sequences and generate over 730K bounding boxes in total. To the
best of our knowledge, LSOTB-TIR is the largest and most diverse TIR object
tracking benchmark to date. To evaluate a tracker on different attributes, we
define 4 scenario attributes and 12 challenge attributes in the evaluation
dataset. By releasing LSOTB-TIR, we encourage the community to develop deep
learning based TIR trackers and evaluate them fairly and comprehensively. We
evaluate and analyze more than 30 trackers on LSOTB-TIR to provide a series of
baselines, and the results show that deep trackers achieve promising
performance. Furthermore, we re-train several representative deep trackers on
LSOTB-TIR, and their results demonstrate that the proposed training dataset
significantly improves the performance of deep TIR trackers. Codes and dataset
are available at https://github.com/QiaoLiuHit/LSOTB-TIR.
- Abstract(参考訳): 本稿では,評価データセットと,合計1,400のTIRシーケンスと600Kフレーム以上のトレーニングデータセットから構成されるLSOTBTIRという,大規模かつ多種多種多様なオブジェクト追跡ベンチマークを提案する。
全列の各フレームにオブジェクトのバウンディングボックスをアノテートし、合計で730k以上のバウンディングボックスを生成します。
我々の知る限り、LSOTB-TIRは、これまでで最大かつ最も多様なTIRオブジェクト追跡ベンチマークである。
異なる属性のトラッカーを評価するために,評価データセットで4つのシナリオ属性と12のチャレンジ属性を定義した。
LSOTB-TIRをリリースすることにより、コミュニティはディープラーニングベースのTIRトラッカーを開発し、それらを公平かつ包括的に評価することを奨励する。
我々は,LSOTB-TIR上で30以上のトラッカーを評価し解析し,一連のベースラインを提供することにより,ディープトラッカーが有望な性能を達成することを示す。
さらに, LSOTB-TIRにおける複数の代表的ディープトラッカーの再訓練を行い, 提案したトレーニングデータセットが深部TIRトラッカーの性能を著しく向上することを示す。
コードとデータセットはhttps://github.com/QiaoLiuHit/LSOTB-TIRで公開されている。
関連論文リスト
- Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - Cross-domain Learning Framework for Tracking Users in RIS-aided Multi-band ISAC Systems with Sparse Labeled Data [55.70071704247794]
統合センシング・通信(ISAC)は6G通信において重要であり、再構成可能なインテリジェントサーフェス(RIS)の急速な発展によって促進される
本稿では,複数の帯域にまたがるマルチモーダルCSIインジケータを協調的に活用し,クロスドメイン方式で追跡機能をモデル化するX2Trackフレームワークを提案する。
X2Trackの下では、トランスフォーマーニューラルネットワークと逆学習技術に基づいて、トラッキングエラーを最小限に抑える効率的なディープラーニングアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-05-10T08:04:27Z) - Long-term Frame-Event Visual Tracking: Benchmark Dataset and Baseline [37.06330707742272]
まず, FELTと呼ばれる, 長期的かつ大規模な単一オブジェクト追跡データセットを提案する。
742の動画と1,594,474のRGBフレームとイベントストリームペアが含まれており、これまでで最大のフレームイベント追跡データセットになっている。
本稿では,RGBとイベントデータの両方を融合させるために,現代的なホップフィールド層をマルチヘッド自己アテンションブロックに導入することで,統一バックボーンとして新しい連想メモリトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2024-03-09T08:49:50Z) - SOMPT22: A Surveillance Oriented Multi-Pedestrian Tracking Dataset [5.962184741057505]
我々はSOMPT22データセットを紹介した。これは、都市監視のための高さ6-8mのポール上の静止カメラから撮影した注釈付きショートビデオを備えた、複数人の追跡のための新しいセットである。
我々は,新しいデータセット上での検出とreIDネットワークの利用方法について,MOTトラッカーをワンショットと2ステージに分類して分析する。
我々の新しいデータセットの実験結果から、SOTAは依然として高効率には程遠いことが示され、シングルショットトラッカーは高速実行と精度を競合性能と一体化するための良い候補である。
論文 参考訳(メタデータ) (2022-08-04T11:09:19Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - LasHeR: A Large-scale High-diversity Benchmark for RGBT Tracking [27.00930976353204]
LasHeRは1224枚の可視・熱赤外ビデオ対と合計730Kフレーム対で構成されている。
LasHeRは、広範囲のオブジェクトカテゴリ、カメラ視点、シーンの複雑さ、環境要因から非常に多様である。
LasHeRデータセット上で12RGBT追跡アルゴリズムの包括的なパフォーマンス評価を行います。
論文 参考訳(メタデータ) (2021-04-27T14:04:23Z) - Benchmarking Deep Trackers on Aerial Videos [5.414308305392762]
本論文では,4つの空中データセットの深層学習手法に基づく10のトラッカーを比較した。
我々は,検出による追跡,識別相関フィルタ,シャムネットワーク,強化学習など,さまざまなアプローチを用いた上位パフォーマンストラッカを選択する。
本研究では, 地上映像と比べ, 航空データセットではトラッカーの性能が著しく悪くなることが示唆された。
論文 参考訳(メタデータ) (2021-03-24T01:45:19Z) - Multi-modal Visual Tracking: Review and Experimental Comparison [85.20414397784937]
マルチモーダルトラッキングアルゴリズム,特に可視深度(RGB-D)と可視温度(RGB-T)を要約する。
5つのデータセット上でトラッカーの有効性を分析する実験を行った。
論文 参考訳(メタデータ) (2020-12-08T02:39:38Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。