論文の概要: Self-Supervised RGB-T Tracking with Cross-Input Consistency
- arxiv url: http://arxiv.org/abs/2301.11274v1
- Date: Thu, 26 Jan 2023 18:11:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-27 12:57:14.888662
- Title: Self-Supervised RGB-T Tracking with Cross-Input Consistency
- Title(参考訳): 入力整合性を考慮した自己監督RGB-T追跡
- Authors: Xingchen Zhang and Yiannis Demiris
- Abstract要約: 本稿では,自己教師付きRGB-Tトラッキング手法を提案する。
我々のトラッカーは、ラベルなしのRGB-Tビデオペアを自己教師方式で訓練する。
我々の知る限りでは、トラッカーは初めての自己監督型RGB-Tトラッカーである。
- 参考スコア(独自算出の注目度): 33.34113942544558
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we propose a self-supervised RGB-T tracking method. Different
from existing deep RGB-T trackers that use a large number of annotated RGB-T
image pairs for training, our RGB-T tracker is trained using unlabeled RGB-T
video pairs in a self-supervised manner. We propose a novel cross-input
consistency-based self-supervised training strategy based on the idea that
tracking can be performed using different inputs. Specifically, we construct
two distinct inputs using unlabeled RGB-T video pairs. We then track objects
using these two inputs to generate results, based on which we construct our
cross-input consistency loss. Meanwhile, we propose a reweighting strategy to
make our loss function robust to low-quality training samples. We build our
tracker on a Siamese correlation filter network. To the best of our knowledge,
our tracker is the first self-supervised RGB-T tracker. Extensive experiments
on two public RGB-T tracking benchmarks demonstrate that the proposed training
strategy is effective. Remarkably, despite training only with a corpus of
unlabeled RGB-T video pairs, our tracker outperforms seven supervised RGB-T
trackers on the GTOT dataset.
- Abstract(参考訳): 本稿では,自己教師付きRGB-Tトラッキング手法を提案する。
トレーニングに多数の注釈付きRGB-Tイメージペアを使用する既存のディープRGB-Tトラッカーとは異なり、RGB-TトラッカーはラベルなしRGB-Tビデオペアを自己管理的にトレーニングする。
本稿では,異なる入力を用いて追跡を行うことができるという考え方に基づく,新たなクロス入力一貫性に基づく自己教師付き学習戦略を提案する。
具体的には、ラベルのないRGB-Tビデオペアを用いて、2つの異なる入力を構築する。
次に、これらの2つの入力を使ってオブジェクトを追跡して結果を生成します。
一方,低品質トレーニングサンプルに対して損失関数を堅牢化するための再重み付け手法を提案する。
我々は,シームズ相関フィルタネットワーク上にトラッカーを構築する。
我々の知る限りでは、トラッカーは初めての自己監督型RGB-Tトラッカーである。
2つの公開RGB-T追跡ベンチマークの大規模な実験は、提案したトレーニング戦略が有効であることを示す。
注目すべきは、ラベルなしのRGB-Tビデオペアのコーパスだけでトレーニングされているにも関わらず、我々のトラッカーはGTOTデータセット上で7つの教師付きRGB-Tトラッカーより優れています。
関連論文リスト
- Learning Dual-Fused Modality-Aware Representations for RGBD Tracking [67.14537242378988]
従来のRGBオブジェクトトラッキングと比較して、奥行きモードの追加は、ターゲットとバックグラウンドの干渉を効果的に解決することができる。
既存のRGBDトラッカーでは2つのモードを別々に使用しており、特に有用な共有情報は無視されている。
DMTracker(Dual-fused Modality-aware Tracker)を提案する。DMTrackerは,RGBDのロバストな追跡のために,対象対象物の情報的および識別的表現を学習することを目的としている。
論文 参考訳(メタデータ) (2022-11-06T07:59:07Z) - RGBD1K: A Large-scale Dataset and Benchmark for RGB-D Object Tracking [30.448658049744775]
注釈付きRGB-D追跡データが限られているため、最先端のRGB-Dトラッカーのほとんどは、高性能なRGB-Dトラッカーの単純な拡張である。
データセット不足問題に対処するため,RGBD1Kという新しいRGB-Dデータセットを報告した。
論文 参考訳(メタデータ) (2022-08-21T03:07:36Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - RGBD Object Tracking: An In-depth Review [89.96221353160831]
まず、RGBD融合、深度利用、追跡フレームワークなど、さまざまな視点からRGBDオブジェクトトラッカーをレビューする。
我々はRGBDトラッカーの代表セットをベンチマークし、その性能に基づいて詳細な分析を行う。
論文 参考訳(メタデータ) (2022-03-26T18:53:51Z) - DepthTrack : Unveiling the Power of RGBD Tracking [29.457114656913944]
この作業では、新しいRGBDトラッキングデータセットであるDepth-Trackが導入されている。
既存の最大データセットの2倍のシーケンス(200)とシーンタイプ(40)を持つ。
シーケンスの平均長(1473)、変形可能なオブジェクト数(16)、追跡属性数(15)が増加する。
論文 参考訳(メタデータ) (2021-08-31T16:42:38Z) - Unsupervised Cross-Modal Distillation for Thermal Infrared Tracking [39.505507508776404]
畳み込みニューラルネットワークによって学習されるターゲット表現は、熱赤外(TIR)トラッキングにおいて重要な役割を果たす。
クロスモーダル蒸留(CMD)を用いたRGBモダリティからTIRモダリティの表現を抽出する。
我々のトラッカーは、それぞれ2.3%の成功、2.7%の精度、2.5%の正規化精度の絶対ゲインを達成して、ベースライントラッカーよりも優れています。
論文 参考訳(メタデータ) (2021-07-31T09:19:59Z) - Jointly Modeling Motion and Appearance Cues for Robust RGB-T Tracking [85.333260415532]
我々はRGBと熱(T)の両モードの融合重量マップを推定する新しい後期融合法を開発した。
外観キューが信頼できない場合には、動作キューを考慮に入れ、トラッカーを堅牢にする。
最近の3つのRGB-T追跡データセットの多くの結果から、提案したトラッカーは他の最先端のアルゴリズムよりも大幅に性能が向上していることが示された。
論文 参考訳(メタデータ) (2020-07-04T08:11:33Z) - Synergistic saliency and depth prediction for RGB-D saliency detection [76.27406945671379]
既存のRGB-Dサリエンシデータセットは小さく、多様なシナリオに対して過度に適合し、限定的な一般化につながる可能性がある。
そこで本研究では,RGB-Dサリエンシ検出のための半教師付きシステムを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。