論文の概要: Dual-level Adaptation for Multi-Object Tracking: Building Test-Time Calibration from Experience and Intuition
- arxiv url: http://arxiv.org/abs/2603.21629v1
- Date: Mon, 23 Mar 2026 06:50:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.530195
- Title: Dual-level Adaptation for Multi-Object Tracking: Building Test-Time Calibration from Experience and Intuition
- Title(参考訳): 複数物体追跡のためのデュアルレベル適応:経験と直観によるテスト時間校正の構築
- Authors: Wen Guo, Pengfei Zhao, Zongmeng Wang, Yufan Hu, Junyu Gao,
- Abstract要約: テスト時間適応(TTA)は、そのような分散シフトを軽減するための有望なパラダイムとして登場した。
本稿では,経験と直観からのテストタイム(TCEI)フレームワークを提案する。
このフレームワークでは、過渡記憶を利用して、最近観測されたオブジェクトをリコールし、迅速な予測を行う。
オンラインテストにおける確実なオブジェクトと不確実なオブジェクトは、歴史的先行と反射的ケースとして活用される。
- 参考スコア(独自算出の注目度): 29.371401864045115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiple Object Tracking (MOT) has long been a fundamental task in computer vision, with broad applications in various real-world scenarios. However, due to distribution shifts in appearance, motion pattern, and catagory between the training and testing data, model performance degrades considerably during online inference in MOT. Test-Time Adaptation (TTA) has emerged as a promising paradigm to alleviate such distribution shifts. However, existing TTA methods often fail to deliver satisfactory results in MOT, as they primarily focus solely on frame-level adaptation while neglecting temporal consistency and identity association across frames and videos. Inspired by human decision-making process, this paper propose a Test-time Calibration from Experience and Intuition (TCEI) framework. In this framework, the Intuitive system utilizes transient memory to recall recently observed objects for rapid predictions, while the Experiential system leverages the accumulated experience from prior test videos to reassess and calibrate these intuitive predictions. Furthermore, both confident and uncertain objects during online testing are exploited as historical priors and reflective cases, respectively, enabling the model to adapt to the testing environment and alleviate performance degradation. Extensive experiments demonstrate that the proposed TCEI framework consistently achieves superior performance across multiple benchmark datasets and significantly enhances the model's adaptability under distribution shifts. The code will be released at https://github.com/1941Zpf/TCEI.
- Abstract(参考訳): 複数オブジェクト追跡(MOT)はコンピュータビジョンの基本的なタスクであり、様々な現実のシナリオにおいて幅広い応用がなされてきた。
しかし、トレーニングデータとテストデータ間の外観、動きパターン、キャラゴリーの分布変化により、MOTのオンライン推論においてモデル性能は著しく低下する。
テスト時間適応(TTA)は、そのような分散シフトを軽減するための有望なパラダイムとして登場した。
しかし、既存のTTA手法は、フレームやビデオ間の時間的一貫性やアイデンティティの関連性を無視しながら、フレームレベルの適応のみに重点を置いているため、MOTで満足な結果をもたらすことができないことが多い。
本稿では,人間の意思決定プロセスにヒントを得て,経験と直観によるテスト時間校正(TCEI)フレームワークを提案する。
このフレームワークでは、過渡記憶を用いて、最近観測されたオブジェクトを高速な予測のためにリコールする一方、Experientialシステムは、以前のテストビデオから蓄積した経験を活用して、これらの直感的な予測を再評価し、校正する。
さらに、オンラインテストにおける確実なオブジェクトと不確実なオブジェクトは、それぞれ過去の先行と反射的ケースとして利用されており、モデルがテスト環境に適応し、性能劣化を軽減することができる。
大規模な実験により、提案したTCEIフレームワークは、複数のベンチマークデータセット間で一貫して優れたパフォーマンスを達成し、分散シフト下でのモデルの適応性を大幅に向上することを示した。
コードはhttps://github.com/1941Zpf/TCEIでリリースされる。
関連論文リスト
- DOTA: Distributional Test-Time Adaptation of Vision-Language Models [69.41389326333771]
トレーニングデータとテストデータの間に大きな分散ギャップが存在する場合、視覚言語の基礎モデルは信頼できない。
本稿では,DOTA(DistributiOnal Test-time Adaptation)を提案する。
この分散中心のアプローチは、モデルが継続的に学習し、デプロイメント環境に適応することを可能にする。
論文 参考訳(メタデータ) (2024-09-28T15:03:28Z) - Enhancing Test Time Adaptation with Few-shot Guidance [62.49199492255226]
深層ニューラルネットワークは、トレーニング(ソース)とテスト(ターゲット)データのドメインシフトに直面しながら、大きなパフォーマンス低下に直面することが多い。
TTA(Test Time Adaptation)法は,事前学習したソースモデルを用いて,配信外ストリーミングターゲットデータを処理する手法として提案されている。
本稿では,Few-Shot Test Time Adaptation (FS-TTA) を開発した。
論文 参考訳(メタデータ) (2024-09-02T15:50:48Z) - Efficient Open Set Single Image Test Time Adaptation of Vision Language Models [15.621092104244003]
動的で現実世界の環境にモデルを適応させることは、ディープラーニングにおける重要な課題である。
動的に更新された機能バンクを利用して信頼性の高いテストサンプルを識別する新しいフレームワークであるROSITAを提案する。
このアプローチは、未知のサンプルを拒絶しながら、既知のクラスに対するドメインシフトにモデルを効果的に適用する。
論文 参考訳(メタデータ) (2024-06-01T16:21:42Z) - Fast-Slow Test-Time Adaptation for Online Vision-and-Language Navigation [67.18144414660681]
オンラインビジョン・アンド・ランゲージナビゲーション(VLN)のためのFSTTA(Fast-Slow Test-Time Adaptation)アプローチを提案する。
提案手法は,4つのベンチマークにおいて顕著な性能向上を実現する。
論文 参考訳(メタデータ) (2023-11-22T07:47:39Z) - DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。
まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。
第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T15:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。