論文の概要: TQD-Track: Temporal Query Denoising for 3D Multi-Object Tracking
- arxiv url: http://arxiv.org/abs/2504.03258v1
- Date: Fri, 04 Apr 2025 08:18:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 14:48:12.757678
- Title: TQD-Track: Temporal Query Denoising for 3D Multi-Object Tracking
- Title(参考訳): TQD-Track:3Dマルチオブジェクト追跡のための時間的クエリ
- Authors: Shuxiao Ding, Yutong Yang, Julian Wiederer, Markus Braun, Peizheng Li, Juergen Gall, Bin Yang,
- Abstract要約: 既存のアプローチは、トラッキング・バイ・アテンション・パラダイムにクエリ・デノイングを統合している。
提案するTQD-Trackは,MOTに適したTQD( Temporal Query Denoising)を提案する。
提案したTQDを異なる追跡パラダイムに対して解析し,そのパラダイムを明示的な学習データアソシエーションモジュールを用いて探索する。
- 参考スコア(独自算出の注目度): 13.004539088540188
- License:
- Abstract: Query denoising has become a standard training strategy for DETR-based detectors by addressing the slow convergence issue. Besides that, query denoising can be used to increase the diversity of training samples for modeling complex scenarios which is critical for Multi-Object Tracking (MOT), showing its potential in MOT application. Existing approaches integrate query denoising within the tracking-by-attention paradigm. However, as the denoising process only happens within the single frame, it cannot benefit the tracker to learn temporal-related information. In addition, the attention mask in query denoising prevents information exchange between denoising and object queries, limiting its potential in improving association using self-attention. To address these issues, we propose TQD-Track, which introduces Temporal Query Denoising (TQD) tailored for MOT, enabling denoising queries to carry temporal information and instance-specific feature representation. We introduce diverse noise types onto denoising queries that simulate real-world challenges in MOT. We analyze our proposed TQD for different tracking paradigms, and find out the paradigm with explicit learned data association module, e.g. tracking-by-detection or alternating detection and association, benefit from TQD by a larger margin. For these paradigms, we further design an association mask in the association module to ensure the consistent interaction between track and detection queries as during inference. Extensive experiments on the nuScenes dataset demonstrate that our approach consistently enhances different tracking methods by only changing the training process, especially the paradigms with explicit association module.
- Abstract(参考訳): クエリの復調は、収束の遅い問題に対処することで、DETRベースの検出器の標準的なトレーニング戦略となっている。
さらに、マルチオブジェクト追跡(MOT)に不可欠な複雑なシナリオをモデリングするためのトレーニングサンプルの多様性を高めるために、クエリのデノベーションが使用することができる。
既存のアプローチは、トラッキング・バイ・アテンション・パラダイムにクエリ・デノイングを統合している。
しかし、認知過程は単一のフレーム内でのみ発生するため、トラッカーが時間的関連情報を学ぶことにはメリットがない。
さらに、照会における注目マスクは、照会とオブジェクトクエリ間の情報交換を防止し、自己注意による関連性の改善の可能性を制限する。
これらの問題に対処するために、MOTに適したTQD(Tonoral Query Denoising)を導入し、時間情報やインスタンス固有の特徴表現を記述できるTQD-Trackを提案する。
我々はMOTの現実的課題をシミュレートするデノイングクエリに多様なノイズタイプを導入している。
我々は,提案したTQDを異なる追跡パラダイムで分析し,より広いマージンでTQDの恩恵を受けるために,明示的な学習データアソシエーションモジュール,例えばgトラッキング・バイ・検出や交互検出・アソシエーションを用いたパラダイムを見出す。
これらのパラダイムのために、我々はさらにアソシエイトモジュール内のアソシエイトマスクを設計し、推論中にトラックと検出クエリ間の一貫した相互作用を確実にする。
nuScenesデータセットの大規模な実験により、トレーニングプロセス、特に明示的なアソシエーションモジュールのパラダイムを変更することで、我々のアプローチは、異なるトラッキング方法を一貫して強化することを示した。
関連論文リスト
- DeTrack: In-model Latent Denoising Learning for Visual Object Tracking [24.993508502786998]
本稿では,視覚的物体追跡問題を認知学習プロセスとして定式化するための新しいパラダイムを提案する。
拡散モデルにインスパイアされた学習は、目に見えないデータに対するモデルの堅牢性を高める。
境界ボックスにノイズを導入し、トレーニング用ノイズボックスを生成し、テストデータに対するモデルロバスト性を向上する。
論文 参考訳(メタデータ) (2025-01-05T07:28:50Z) - Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization [60.899082019130766]
本稿では、フレームレベル検出ネットワーク(FDN)と、音声の時間的偽造検出とローカライゼーションのための改良ネットワーク(PRN)を提案する。
FDNは、偽のフレーム間で情報的不整合の手がかりを抽出し、偽の領域を大まかに示すのに有用な識別的特徴を得る。
PRNは、FDNから派生した粗粒度の提案を洗練するために、信頼スコアと回帰オフセットを予測する責任がある。
論文 参考訳(メタデータ) (2024-07-23T15:07:52Z) - Fast Window-Based Event Denoising with Spatiotemporal Correlation
Enhancement [85.66867277156089]
同時にイベントのスタックを扱うウィンドウベースのイベントデノゲーションを提案する。
空間領域では、実世界の事象と雑音を識別するために、最大後部(MAP)を選択する。
我々のアルゴリズムは、イベントノイズを効果的かつ効率的に除去し、下流タスクの性能を向上させることができる。
論文 参考訳(メタデータ) (2024-02-14T15:56:42Z) - iKUN: Speak to Trackers without Retraining [21.555469501789577]
市販トラッカーとの通信を実現するため,iKUNと呼ばれる挿入可能な知識統一ネットワークを提案する。
局所化精度を向上させるために,プロセスノイズを動的に調整するKalman filter (NKF) のニューラルバージョンを提案する。
また、パブリックなDanceTrackデータセットをモーションとドレッシング記述で拡張することで、より困難なデータセットであるRefer-Danceにもコントリビュートしています。
論文 参考訳(メタデータ) (2023-12-25T11:48:55Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - DINF: Dynamic Instance Noise Filter for Occluded Pedestrian Detection [0.0]
RCNNベースの歩行者検出器は、矩形領域を使用してインスタンスの特徴を抽出する。
重なり合うオブジェクトの数とわずかに重なり合うオブジェクトの数は不均衡である。
RCNNをベースとした歩行者検知器の信号雑音比を改善するために, 繰り返し動的インスタンスノイズフィルタ (DINF) を提案する。
論文 参考訳(メタデータ) (2023-01-13T14:12:36Z) - Robust Semantic Communications with Masked VQ-VAE Enabled Codebook [56.63571713657059]
本稿では,ロバストなエンドツーエンドのセマンティック通信システムにおいて,セマンティックノイズに対処するためのフレームワークを提案する。
セマンティックノイズに対処するため、重み付き対向トレーニングを開発し、トレーニングデータセットにセマンティックノイズを組み込む。
ノイズやタスク非関連の特徴を抑える機能重要モジュール (FIM) を開発した。
論文 参考訳(メタデータ) (2022-06-08T16:58:47Z) - A Free Lunch to Person Re-identification: Learning from Automatically
Generated Noisy Tracklets [52.30547023041587]
非教師付きビデオベース再識別(re-ID)手法は、re-IDデータセットのアノテートに必要な高コストの問題を解決するために提案されている。
しかし、彼らのパフォーマンスは監督対象よりもはるかに低い。
本稿では,自動生成人追跡装置から再IDモデルを学習することで,この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-04-02T16:18:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。