論文の概要: Active Adversarial Perturbation-driven Associative Memory Retrieval for RGB-Event Visual Object Tracking
- arxiv url: http://arxiv.org/abs/2606.26455v1
- Date: Wed, 24 Jun 2026 23:34:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 18:46:32.112517
- Title: Active Adversarial Perturbation-driven Associative Memory Retrieval for RGB-Event Visual Object Tracking
- Title(参考訳): RGB-Event Visual Object Trackingのための能動対向摂動駆動型連想記憶検索
- Authors: Xiao Wang, Xufeng Lou, Zikang Yan, Lan Chen, Sibao Chen, Yaowei Wang, Yonghong Tian, Jin Tang,
- Abstract要約: RGB-Eventトラッキングは、イベントセンサからRGB外観テクスチャと高密度時間運動キューを融合することにより、ローカライズを改善する。
現実世界のシーンは、従来のマルチモーダル融合を妨げる多様な構造的な信号劣化に悩まされる。
本稿では,RGBイベント追跡に適した階層的摂動・検索フレームワークを提案する。
- 参考スコア(独自算出の注目度): 58.338848435042536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGB-Event tracking improves localization robustness by fusing RGB appearance textures and dense temporal motion cues from event sensors. While this multi-modal scheme broadens tracking applicability, real-world scenes suffer diverse structured signal degradations that hinder traditional multi-modal fusion. In harsh environments, either modality can lose reliability drastically, and targets frequently appear incomplete due to occlusion, edge truncation and foreground clutter.To tackle the above challenges, we present a hierarchical perturbation and retrieval framework tailored for RGB-Event tracking with robustness against partial target missing and modal degradation, termed APRTrack. To mimic real-world signal corruption, APRTrack constructs structured degradation via two adversarial perturbation branches at the modality and spatial levels, which separately simulate full-modal failure and localized target region absence. A hierarchical routing mechanism is designed to disentangle the training pipelines of the two perturbation types, effectively eliminating feature collapse induced by superimposed degradation constraints. Furthermore, we devise Footprint-guided Channel-calibrated Hopfield Retrieval (FCHR) for reliable historical information compensation. This module evaluates retrieval confidence based on association footprints between queries and memory banks, and calibrates the retrieval metric space prior to Hopfield matching, realizing controllable historical feature compensation bounded to target regions. Extensive experiments on FE108, COESOT, VisEvent, and FELT datasets demonstrate the effectiveness of our proposed strategies for the RGB-Event visual object tracking. The source code and pre-trained models will be released on https://github.com/Event-AHU/OpenEvTracking
- Abstract(参考訳): RGB-Eventトラッキングは、イベントセンサからRGB外観テクスチャと高密度時間運動キューを融合することにより、ローカライズロバスト性を向上させる。
このマルチモーダル・スキームは適用性を追跡するが、現実のシーンは多様な構造的な信号劣化に悩まされ、従来のマルチモーダル・フュージョンを妨げている。
過酷な環境下では、どちらのモードも信頼性を著しく損なうことがあり、また、咬合、エッジトランケーション、前景のクラッタなどによりターゲットが不完全な場合が多く、上記の課題に対処するために、部分的ターゲットの欠落やモード劣化に対する堅牢性を備えたRGB-Eventトラッキングに適した階層的摂動と検索フレームワーク、APRTrackを提案する。
実世界の信号の破損を模倣するため、APRTrackは2つの対向的摂動分岐をモダリティと空間レベルで構成し、完全なモード障害と局所的なターゲット領域の欠如を個別にシミュレートする。
階層的ルーティング機構は、2つの摂動型のトレーニングパイプラインをアンタングル化し、重畳された劣化制約によって引き起こされる特徴の崩壊を効果的に除去するように設計されている。
さらに,フットプリント型チャネル校正ホップフィールド検索 (FCHR) を,信頼性の高い歴史的情報補償のために考案した。
本モジュールは,クエリとメモリバンク間の相関フットプリントに基づいて検索信頼度を評価し,ホップフィールドマッチングに先立って検索距離空間を校正し,対象領域に限定した制御可能な履歴特徴補償を実現する。
FE108, COESOT, VisEvent, FELTデータセットの大規模な実験により, RGB-Eventビジュアルオブジェクト追跡のための提案手法の有効性が示された。
ソースコードと事前トレーニングされたモデルはhttps://github.com/Event-AHU/OpenEvTrackingでリリースされる。
関連論文リスト
- FEMOT: Multi-Object Tracking using Frame and Event Cameras [57.75021868843091]
バイオインスパイアされたイベントカメラは、高時間分解能と高ダイナミックレンジを提供し、極端なシナリオ下で補完的な手がかりを提供する。
FEMOTは、さまざまな現実シナリオと14の課題属性をカバーした、大規模でRGBのマルチオブジェクト追跡データセットである。
FEMOTRは、RGBとイベント機能を分離し、周波数領域でそれらを融合するマルチモーダルトラッキングフレームワークである。
論文 参考訳(メタデータ) (2026-06-12T04:17:41Z) - Spatial Orthogonal Refinement for Robust RGB-Event Visual Object Tracking [8.019596736149834]
空間直交微細化(SOR)に基づくロバストなRGBイベント追跡のためのフレームワークであるSOR-Trackを提案する。
大規模なFE108ベンチマークの実験は、SOR-Trackが既存のフュージョンベースのトラッカーを一貫して上回っていることを示している。
その単純さにもかかわらず、提案手法はマルチモーダルな特徴アライメントとテクスチャの整合に対する原理的かつ物理的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-03-29T23:54:31Z) - PEPR: Privileged Event-based Predictive Regularization for Domain Generalization [19.185122873391517]
本稿では,厳密な単一モダリティRGBモデルをトレーニングするための特権情報(LUPI)パラダイムを用いた学習環境下でのクロスモーダルフレームワークを提案する。
イベントカメラを特権情報のソースとして利用し、トレーニング中にのみ利用可能です。
RGBエンコーダをPEPRでトレーニングし、イベントベースの潜伏特性を予測し、意味豊かさを犠牲にすることなくロバスト性を蒸留する。
論文 参考訳(メタデータ) (2026-02-04T14:10:36Z) - Decoupling Amplitude and Phase Attention in Frequency Domain for RGB-Event based Visual Object Tracking [51.31378940976401]
既存のRGB-Eventトラッキングアプローチでは、イベントカメラのユニークな利点を完全に活用できない。
本稿では,周波数領域の早期融合を実現する新しい追跡フレームワークを提案する。
FE108, FELT, COESOTなど, 広く使用されている3つのRGB-Event追跡ベンチマークデータセットの実験により, 提案手法の性能と効率を実証した。
論文 参考訳(メタデータ) (2026-01-03T01:10:17Z) - Implicit Event-RGBD Neural SLAM [54.74363487009845]
神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文 参考訳(メタデータ) (2023-11-18T08:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。