論文の概要: YOLO-IOD: Towards Real Time Incremental Object Detection
- arxiv url: http://arxiv.org/abs/2512.22973v1
- Date: Sun, 28 Dec 2025 15:35:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.30595
- Title: YOLO-IOD: Towards Real Time Incremental Object Detection
- Title(参考訳): YOLO-IOD:リアルタイムインクリメンタルオブジェクト検出に向けて
- Authors: Shizhou Zhang, Xueqiang Lv, Yinghui Xing, Qirui Wu, Di Xu, Chen Zhao, Yanning Zhang,
- Abstract要約: 本稿では、事前訓練されたYOLO-Worldモデルに基づいて構築されたリアルタイムインクリメンタルオブジェクト検出(IOD)フレームワークであるYOLO-IODを紹介する。
YOLO-IODは3つの主要な構成要素を含む: 1) 衝突を意識した擬似ラベルリファインメント(CPR)は、前景と背景の混乱を緩和する。
また, クロスステージ非対称な知識蒸留法 (CAKD) を導入する。
- 参考スコア(独自算出の注目度): 57.862742461237055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current methods for incremental object detection (IOD) primarily rely on Faster R-CNN or DETR series detectors; however, these approaches do not accommodate the real-time YOLO detection frameworks. In this paper, we first identify three primary types of knowledge conflicts that contribute to catastrophic forgetting in YOLO-based incremental detectors: foreground-background confusion, parameter interference, and misaligned knowledge distillation. Subsequently, we introduce YOLO-IOD, a real-time Incremental Object Detection (IOD) framework that is constructed upon the pretrained YOLO-World model, facilitating incremental learning via a stage-wise parameter-efficient fine-tuning process. Specifically, YOLO-IOD encompasses three principal components: 1) Conflict-Aware Pseudo-Label Refinement (CPR), which mitigates the foreground-background confusion by leveraging the confidence levels of pseudo labels and identifying potential objects relevant to future tasks. 2) Importancebased Kernel Selection (IKS), which identifies and updates the pivotal convolution kernels pertinent to the current task during the current learning stage. 3) Cross-Stage Asymmetric Knowledge Distillation (CAKD), which addresses the misaligned knowledge distillation conflict by transmitting the features of the student target detector through the detection heads of both the previous and current teacher detectors, thereby facilitating asymmetric distillation between existing and newly introduced categories. We further introduce LoCo COCO, a more realistic benchmark that eliminates data leakage across stages. Experiments on both conventional and LoCo COCO benchmarks show that YOLO-IOD achieves superior performance with minimal forgetting.
- Abstract(参考訳): インクリメンタルオブジェクト検出(IOD)の現在の手法は、主により高速なR-CNNまたはDETR系列検出器に依存しているが、これらの手法はリアルタイムのYOLO検出フレームワークに対応していない。
本稿では, ヨロをベースとしたインクリメンタル検出器において, 破滅的忘れ込みに寄与する3つの主要な知識衝突を, 前地背景の混乱, パラメータ干渉, ミスアライメントされた知識蒸留の3つを最初に同定する。
次に、事前訓練されたYOLO-Worldモデルに基づいて構築されたリアルタイムインクリメンタルオブジェクト検出(IOD)フレームワークであるYOLO-IODを紹介し、段階的にパラメータ効率の良い微調整プロセスを通じて漸進的な学習を容易にする。
具体的には、YOLO-IODは3つの主成分を含む。
1) Pseudo-Label Refinement (CPR)は,擬似ラベルの信頼性レベルを活用し,今後の課題に関連する潜在的な対象を特定することにより,前景の混乱を緩和する。
2)IKS(Iportance Based Kernel Selection)は,現在の学習段階において,現在のタスクに関連付けられた重要な畳み込みカーネルを特定し,更新する。
3) 従来と現在の両方の教師検出器の検知ヘッドを介して, 学生目標検出器の特徴を伝達することにより, 従来と新たに導入されたカテゴリ間の非対称蒸留を容易にすることで, 知識蒸留紛争に対処するクロスステージ非対称知識蒸留(CAKD)。
さらに私たちは,ステージ全体のデータ漏洩を排除する,より現実的なベンチマークであるLoCo COCOを紹介します。
従来のCOCOベンチマークとLoCo COCOベンチマークの両方の実験では、YOLO-IODは最小限の忘れ込みで優れたパフォーマンスを達成している。
関連論文リスト
- YOLOA: Real-Time Affordance Detection via LLM Adapter [96.61111291833544]
Affordance Detectionは、インボディードAIにおける基本的な"ハウツーハウ"の課題に共同で対処することを目的としている。
本稿では、オブジェクト検出と空き学習を協調的に扱うリアルタイムな空き検出モデルであるYOLO Affordance(YOLOA)を紹介する。
ADG-Det と IIT-Heat のベンチマーク実験により,YOLOA がリアルタイム性能を維持しながら最先端の精度を実現していることが示された。
論文 参考訳(メタデータ) (2025-12-03T03:53:31Z) - DuET: Dual Incremental Object Detection via Exemplar-Free Task Arithmetic [12.91797400491484]
自律走行や監視のような現実世界の物体検出システムは、新しい対象カテゴリーを継続的に学習する必要がある。
既存のアプローチでは、クラスインクリメンタルオブジェクト検出(CIOD)とドメインインクリメンタルオブジェクト検出(DIOD)がこの課題の1つの側面にのみ対応している。
DuIOD(Dual Incremental Object Detection)は,クラスとドメインのシフトを同時に処理する,より実用的な設定法である。
論文 参考訳(メタデータ) (2025-06-26T13:41:47Z) - Revisiting Out-of-Distribution Detection in Real-time Object Detection: From Benchmark Pitfalls to a New Mitigation Paradigm [8.206992765692535]
アウト・オブ・ディストリビューション(OoD)入力はディープラーニングモデルに永続的な課題をもたらす。
この研究は、物体検出におけるOoD検出の2つの見落としられた次元に対処する。
外部OoD検出器とは独立に動作する新しい訓練時間緩和パラダイムを導入する。
論文 参考訳(メタデータ) (2025-03-10T13:42:41Z) - Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection [5.6148728159802035]
YOLOのようなリアルタイムオブジェクト検出器は、複数のエポックのための大規模なデータセットでトレーニングされた場合、例外的なパフォーマンスを達成する。
データが徐々に到着する現実のシナリオでは、ニューラルネットワークは破滅的な忘れに苦しむ。
YOLOを用いた連続物体検出に適した自己蒸留法であるYOLO LwFを紹介する。
論文 参考訳(メタデータ) (2025-03-06T18:31:41Z) - 3A-YOLO: New Real-Time Object Detectors with Triple Discriminative Awareness and Coordinated Representations [0.0]
本研究の目的は、複数の注意機構を活用し、YOLO検出ヘッドの3つの識別的認識を階層的に強化することである。
まず,TDA-YOLOモジュールを新たに提案し,スケール認識,空間認識,タスク認識の学習を統一的に行う。
第2に、中間特徴を操り、チャネル間の関係と正確な位置情報を協調的に学習する。
論文 参考訳(メタデータ) (2024-12-10T04:01:32Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Triggering Failures: Out-Of-Distribution detection by learning from
local adversarial attacks in Semantic Segmentation [76.2621758731288]
セグメンテーションにおけるアウト・オブ・ディストリビューション(OOD)オブジェクトの検出に取り組む。
私たちの主な貢献は、ObsNetと呼ばれる新しいOOD検出アーキテクチャであり、ローカル・アタック(LAA)に基づく専用トレーニングスキームと関連付けられています。
3つの異なるデータセットの文献の最近の10つの手法と比較して,速度と精度の両面で最高の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-08-03T17:09:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。