論文の概要: Challenge-Aware RGBT Tracking
- arxiv url: http://arxiv.org/abs/2007.13143v1
- Date: Sun, 26 Jul 2020 15:11:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 20:02:13.486666
- Title: Challenge-Aware RGBT Tracking
- Title(参考訳): チャレンジ対応RGBT追跡
- Authors: Chenglong Li, Lei Liu, Andong Lu, Qing Ji, and Jin Tang
- Abstract要約: 本稿では,モダリティに偏った課題と,モダリティに特有の課題に対処する,新たな課題認識ニューラルネットワークを提案する。
提案手法は,3つのベンチマークデータセット上での最先端手法に対して高い性能を保ちながら,リアルタイムに動作可能であることを示す。
- 参考スコア(独自算出の注目度): 32.88141817679821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB and thermal source data suffer from both shared and specific challenges,
and how to explore and exploit them plays a critical role to represent the
target appearance in RGBT tracking. In this paper, we propose a novel
challenge-aware neural network to handle the modality-shared challenges (e.g.,
fast motion, scale variation and occlusion) and the modality-specific ones
(e.g., illumination variation and thermal crossover) for RGBT tracking. In
particular, we design several parameter-shared branches in each layer to model
the target appearance under the modality-shared challenges, and several
parameterindependent branches under the modality-specific ones. Based on the
observation that the modality-specific cues of different modalities usually
contains the complementary advantages, we propose a guidance module to transfer
discriminative features from one modality to another one, which could enhance
the discriminative ability of some weak modality. Moreover, all branches are
aggregated together in an adaptive manner and parallel embedded in the backbone
network to efficiently form more discriminative target representations. These
challenge-aware branches are able to model the target appearance under certain
challenges so that the target representations can be learnt by a few parameters
even in the situation of insufficient training data. From the experimental
results we will show that our method operates at a real-time speed while
performing well against the state-of-the-art methods on three benchmark
datasets.
- Abstract(参考訳): RGBと熱源のデータは、共有と特定の課題の両方に悩まされており、RGBTトラッキングにおけるターゲットの外観を表現するために、それらを探索して活用する方法が重要な役割を果たす。
本稿では,RGBT追跡のためのモダリティ共有課題(高速運動,スケール変動,閉塞など)と,モダリティ固有課題(照明変動,サーマルクロスオーバーなど)を扱う,新たな課題認識ニューラルネットワークを提案する。
特に,各層におけるパラメータシェード分岐を設計し,モダリティシェード課題下でのターゲットの外観をモデル化し,パラメータ非依存分岐をモダリティ特異的にモデル化する。
異なるモダリティのモダリティ特有の手がかりが通常相補的な利点を含むという観測に基づいて、あるモダリティから別のモダリティへ識別的特徴を移すための誘導モジュールを提案し、いくつかの弱いモダリティの識別能力を高めることができる。
さらに、すべてのブランチを適応的に集約し、バックボーンネットワークに並列組み込み、より識別可能なターゲット表現を効率的に形成する。
これらのチャレンジアウェアなブランチは、特定の課題の下でターゲットの外観をモデル化することができ、トレーニングデータ不足の状況でも、ターゲット表現をいくつかのパラメータで学習することができる。
実験結果から,提案手法は3つのベンチマークデータセットの最先端手法に対して高い性能を保ちながら,リアルタイムに動作可能であることを示す。
関連論文リスト
- Towards a Generalist and Blind RGB-X Tracker [91.36268768952755]
我々は、推論時間中に任意のモダリティ X を無視できる単一のモデルトラッカーを開発する。
トレーニングプロセスは非常にシンプルで,複数ラベルの分類損失をルーティング関数に統合する。
我々のジェネラリストとブラインドトラッカーは、確立されたモーダル固有モデルと比較して、競争性能を達成することができる。
論文 参考訳(メタデータ) (2024-05-28T03:00:58Z) - Modality Prompts for Arbitrary Modality Salient Object Detection [57.610000247519196]
本論文は、任意のモーダリティ・サリエント物体検出(AM SOD)の課題について述べる。
任意のモダリティ、例えばRGBイメージ、RGB-Dイメージ、RGB-D-Tイメージから有能なオブジェクトを検出することを目的としている。
AM SODの2つの基本的な課題を解明するために,新しいモード適応トランス (MAT) を提案する。
論文 参考訳(メタデータ) (2024-05-06T11:02:02Z) - Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.48494594909123]
相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文 参考訳(メタデータ) (2024-01-18T15:56:23Z) - Modality-missing RGBT Tracking: Invertible Prompt Learning and High-quality Benchmarks [21.139161163767884]
モーダル情報は、熱センサーの自己校正やデータ伝送誤差などの要因によって見逃される可能性がある。
本稿では、コンテンツ保存プロンプトをよく訓練された追跡モデルに統合する、新しい非可逆的プロンプト学習手法を提案する。
提案手法は,最先端手法と比較して,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-12-25T11:39:00Z) - Leveraging Diffusion Disentangled Representations to Mitigate Shortcuts
in Underspecified Visual Tasks [92.32670915472099]
拡散確率モデル(DPM)を用いた合成カウンターファクトの生成を利用したアンサンブルの多様化フレームワークを提案する。
拡散誘導型分散化は,データ収集を必要とする従来の手法に匹敵するアンサンブル多様性を達成し,ショートカットからの注意を回避できることを示す。
論文 参考訳(メタデータ) (2023-10-03T17:37:52Z) - One-stage Modality Distillation for Incomplete Multimodal Learning [7.791488931628906]
本稿では,特権的知識伝達とモダリティ情報融合を一体化する一段階のモダリティ蒸留フレームワークを提案する。
提案手法は,各シーンにおける不完全なモダリティ入力の問題を克服し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-15T07:12:27Z) - CMTR: Cross-modality Transformer for Visible-infrared Person
Re-identification [38.96033760300123]
可視赤外人物再識別のための相互モダリティトランスフォーマー法(CMTR)
我々は,モダリティの情報をエンコードするために,トークン埋め込みと融合した新しいモダリティ埋め込みを設計する。
提案するCMTRモデルの性能は,既存のCNN方式をはるかに上回っている。
論文 参考訳(メタデータ) (2021-10-18T03:12:59Z) - RGBT Tracking via Multi-Adapter Network with Hierarchical Divergence
Loss [37.99375824040946]
本稿では,モダリティ共有型,モダリティ特化型,インスタンス認識型ターゲット表現学習を共同で行うための,新しいマルチアダプタネットワークを提案する。
2つのRGBT追跡ベンチマークデータセットの実験は、提案したトラッカーの優れた性能を示す。
論文 参考訳(メタデータ) (2020-11-14T01:50:46Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。