論文の概要: LasHeR: A Large-scale High-diversity Benchmark for RGBT Tracking
- arxiv url: http://arxiv.org/abs/2104.13202v1
- Date: Tue, 27 Apr 2021 14:04:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 17:26:47.263511
- Title: LasHeR: A Large-scale High-diversity Benchmark for RGBT Tracking
- Title(参考訳): LasHeR: RGBT追跡のための大規模高多様性ベンチマーク
- Authors: Chenglong Li, Wanlin Xue, Yaqing Jia, Zhichen Qu, Bin Luo, and Jin
Tang
- Abstract要約: LasHeRは1224枚の可視・熱赤外ビデオ対と合計730Kフレーム対で構成されている。
LasHeRは、広範囲のオブジェクトカテゴリ、カメラ視点、シーンの複雑さ、環境要因から非常に多様である。
LasHeRデータセット上で12RGBT追跡アルゴリズムの包括的なパフォーマンス評価を行います。
- 参考スコア(独自算出の注目度): 27.00930976353204
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: RGBT tracking receives a surge of interest in the computer vision community,
but this research field lacks a large-scale and high-diversity benchmark
dataset, which is essential for both the training of deep RGBT trackers and the
comprehensive evaluation of RGBT tracking methods. To this end, we present a
Large-scale High-diversity benchmark for RGBT tracking (LasHeR) in this work.
LasHeR consists of 1224 visible and thermal infrared video pairs with more than
730K frame pairs in total. Each frame pair is spatially aligned and manually
annotated with a bounding box, making the dataset well and densely annotated.
LasHeR is highly diverse capturing from a broad range of object categories,
camera viewpoints, scene complexities and environmental factors across seasons,
weathers, day and night. We conduct a comprehensive performance evaluation of
12 RGBT tracking algorithms on the LasHeR dataset and present detailed analysis
to clarify the research room in RGBT tracking. In addition, we release the
unaligned version of LasHeR to attract the research interest for alignment-free
RGBT tracking, which is a more practical task in real-world applications. The
datasets and evaluation protocols are available at:
https://github.com/BUGPLEASEOUT/LasHeR.
- Abstract(参考訳): RGBTトラッキングはコンピュータビジョンコミュニティに注目が集まっているが、この研究分野には大規模かつ高多様性のベンチマークデータセットが欠落しており、深部RGBTトラッカーのトレーニングとRGBTトラッカーの包括的な評価の両方に不可欠である。
そこで本研究では,RGBT追跡のための大規模高多様性ベンチマーク(LasHeR)を提案する。
LasHeRは1224枚の可視・熱赤外ビデオ対と合計730Kフレーム対で構成されている。
各フレームペアは空間的にアライメントされ、バウンディングボックスで手動でアノテートされるため、データセットは良好かつ密にアノテートされる。
LasHeRは、季節、天気、昼夜を問わず、幅広い対象カテゴリー、カメラ視点、シーンの複雑さ、環境要因から非常に多様である。
本稿では、LasHeRデータセット上で12RGBT追跡アルゴリズムの総合的な性能評価を行い、RGBT追跡実験室の詳細な解析を行った。
さらに,実世界のアプリケーションにおいてより実用的なタスクであるアライメントフリーなrgbtトラッキングに対する研究関心を引き付けるために,lasherの非アライメント版をリリースする。
データセットと評価プロトコルは以下の通りである。
関連論文リスト
- Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - RGBD Object Tracking: An In-depth Review [89.96221353160831]
まず、RGBD融合、深度利用、追跡フレームワークなど、さまざまな視点からRGBDオブジェクトトラッカーをレビューする。
我々はRGBDトラッカーの代表セットをベンチマークし、その性能に基づいて詳細な分析を行う。
論文 参考訳(メタデータ) (2022-03-26T18:53:51Z) - A Survey for Deep RGBT Tracking [0.0]
可視光(RGB)と熱赤外(TIR)電磁波(RGBT)による物体追跡は、最近トラッキングコミュニティで注目を集めている。
ディープラーニングの急速な発展を考えると、最近のディープニューラルネットワークベースのRGBTトラッカーのサーベイが紹介されている。
論文 参考訳(メタデータ) (2022-01-23T15:52:26Z) - Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT
Benchmark for Crowd Counting [109.32927895352685]
RGBT Crowd Counting (RGBT-CC) ベンチマークは2,030対のRGB熱画像と138,389人の注釈付き画像を含む。
マルチモーダルな群集カウントを容易にするために,クロスモーダルな協調表現学習フレームワークを提案する。
RGBT-CCベンチマークで行った実験は、RGBTの群集カウントにおけるフレームワークの有効性を示した。
論文 参考訳(メタデータ) (2020-12-08T16:18:29Z) - Multi-modal Visual Tracking: Review and Experimental Comparison [85.20414397784937]
マルチモーダルトラッキングアルゴリズム,特に可視深度(RGB-D)と可視温度(RGB-T)を要約する。
5つのデータセット上でトラッカーの有効性を分析する実験を行った。
論文 参考訳(メタデータ) (2020-12-08T02:39:38Z) - LSOTB-TIR:A Large-Scale High-Diversity Thermal Infrared Object Tracking
Benchmark [51.1506855334948]
本稿では、LSOTBTIRと呼ばれる、大規模かつ多種多様な熱赤外(TIR)オブジェクト追跡ベンチマークを提案する。
すべての列のすべてのフレームにおけるオブジェクトの有界ボックスに注釈を付け、合計で730K以上の有界ボックスを生成する。
我々は,LSOTB-TIR上で30以上のトラッカーを評価し解析し,一連のベースラインを提供することにより,ディープトラッカーが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2020-08-03T12:36:06Z) - RGBT Salient Object Detection: A Large-scale Dataset and Benchmark [12.14043884641457]
RGBと熱赤外画像の利点を生かして、複雑な場面で顕著な物体を検出する新たな研究方向となる。
この研究はVT5000という名のRGBT画像データセットに寄与し、5000の空間的整列されたRGBT画像対と地上の真理アノテーションを含んでいる。
本稿では,各モードの多レベル特徴を抽出し,すべてのモードの特徴をアテンション機構で集約する,強力なベースラインアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-07T07:58:14Z) - TAO: A Large-Scale Benchmark for Tracking Any Object [95.87310116010185]
オブジェクトのデータセットの追跡は2,907本の高解像度ビデオで構成され、平均で30分の長さの多様な環境でキャプチャされる。
ビデオの任意の時点で移動するオブジェクトにアノテータにラベルを付け、ファクトラムの後に名前を付けるように求めます。
我々の語彙は、既存の追跡データセットと著しく大きく、質的に異なる。
論文 参考訳(メタデータ) (2020-05-20T21:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。