論文の概要: Replay Consolidation with Label Propagation for Continual Object Detection
- arxiv url: http://arxiv.org/abs/2409.05650v1
- Date: Mon, 9 Sep 2024 14:16:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 14:29:54.986935
- Title: Replay Consolidation with Label Propagation for Continual Object Detection
- Title(参考訳): 連続物体検出のためのラベル伝搬によるリプレイ強化
- Authors: Riccardo De Monte, Davide Dalle Pezze, Marina Ceccon, Francesco Pasti, Francesco Paissan, Elisabetta Farella, Gian Antonio Susto, Nicola Bellotto,
- Abstract要約: オブジェクト検出のための連続学習は、分類のためのCLに比べてさらに困難である。
CLODでは、以前のタスクからのイメージには、将来のタスクでラベル付けされた未知のクラスが含まれている可能性がある。
本稿では,オブジェクト検出のためのラベル伝搬を用いたリプレイ統合(Replay Consolidation with Label Propagation)という,CLODを解く新しい手法を提案する。
- 参考スコア(独自算出の注目度): 7.454468349023651
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object Detection is a highly relevant computer vision problem with many applications such as robotics and autonomous driving. Continual Learning~(CL) considers a setting where a model incrementally learns new information while retaining previously acquired knowledge. This is particularly challenging since Deep Learning models tend to catastrophically forget old knowledge while training on new data. In particular, Continual Learning for Object Detection~(CLOD) poses additional difficulties compared to CL for Classification. In CLOD, images from previous tasks may contain unknown classes that could reappear labeled in future tasks. These missing annotations cause task interference issues for replay-based approaches. As a result, most works in the literature have focused on distillation-based approaches. However, these approaches are effective only when there is a strong overlap of classes across tasks. To address the issues of current methodologies, we propose a novel technique to solve CLOD called Replay Consolidation with Label Propagation for Object Detection (RCLPOD). Based on the replay method, our solution avoids task interference issues by enhancing the buffer memory samples. Our method is evaluated against existing techniques in CLOD literature, demonstrating its superior performance on established benchmarks like VOC and COCO.
- Abstract(参考訳): 物体検出は、ロボット工学や自律運転などの多くの応用において、非常に関連性の高いコンピュータビジョン問題である。
継続学習~(CL)は、モデルが以前獲得した知識を維持しながら、段階的に新しい情報を学習する環境を考える。
ディープラーニングモデルは、新しいデータをトレーニングしながら、古い知識を破滅的に忘れてしまう傾向があるため、これは特に難しい。
特に、オブジェクト検出のための連続学習~(CLOD)は、分類のためのCLに比べてさらに困難である。
CLODでは、以前のタスクからのイメージには、将来のタスクでラベル付けされた未知のクラスが含まれている可能性がある。
これらのアノテーションの欠如は、リプレイベースのアプローチにタスク干渉の問題を引き起こす。
その結果、文献におけるほとんどの研究は蒸留に基づくアプローチに焦点をあてている。
しかし、これらのアプローチはタスク間でクラスが強く重複している場合にのみ有効である。
近年の手法の課題に対処するため,RCLPOD (Replay Consolidation with Label Propagation for Object Detection) と呼ばれるCLODの解法を提案する。
このリプレイ法に基づき,バッファメモリサンプルの強化によるタスク干渉問題を回避する。
提案手法はCLOD文献における既存の手法と比較して評価され,VOCやCOCOといった既存のベンチマークよりも優れた性能を示した。
関連論文リスト
- Reducing Catastrophic Forgetting in Online Class Incremental Learning Using Self-Distillation [3.8506666685467343]
連続学習では、モデルが新しいタスクを学ぶと、以前の知識は忘れられる。
本稿では, 自己蒸留による伝達可能な知識の獲得により, この問題の解決を試みた。
提案手法は,CIFAR10,CIFAR100,MinimageNetデータセットを用いた実験により従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-17T16:26:33Z) - Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-05-23T08:43:09Z) - Enhancing Consistency and Mitigating Bias: A Data Replay Approach for
Incremental Learning [100.7407460674153]
ディープラーニングシステムは、一連のタスクから学ぶとき、破滅的な忘れがちだ。
問題を緩和するため、新しいタスクを学ぶ際に経験豊富なタスクのデータを再生する手法が提案されている。
しかし、メモリ制約やデータプライバシーの問題を考慮すると、実際には期待できない。
代替として、分類モデルからサンプルを反転させることにより、データフリーなデータ再生法を提案する。
論文 参考訳(メタデータ) (2024-01-12T12:51:12Z) - Dealing with Cross-Task Class Discrimination in Online Continual
Learning [54.31411109376545]
本稿では,クラスインクリメンタルラーニング(CIL)における新たな課題について論じる。
新しいタスクのクラスと古いタスクの間の決定境界を、古いタスクデータへの(あるいは制限された)アクセスなしで設定する方法。
リプレイ方式では、前のタスクから少量のデータ(再生データ)を節約する。現在のタスクデータのバッチが到着すると、システムは、新しいデータとサンプルデータとを共同でトレーニングする。
本稿では,リプレイ手法には動的トレーニングバイアスの問題があり,CTCD問題の解法におけるリプレイデータの有効性を低下させる。
論文 参考訳(メタデータ) (2023-05-24T02:52:30Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - vCLIMB: A Novel Video Class Incremental Learning Benchmark [53.90485760679411]
本稿では,ビデオ連続学習ベンチマークvCLIMBを紹介する。
vCLIMBは、ビデオ連続学習における深層モデルの破滅的な忘れを解析するための標準化されたテストベッドである。
本稿では,メモリベース連続学習法に適用可能な時間的整合性正規化を提案する。
論文 参考訳(メタデータ) (2022-01-23T22:14:17Z) - Distilling Knowledge from Refinement in Multiple Instance Detection
Networks [0.0]
弱教師付きオブジェクト検出(WSOD)は、ラベル付き画像カテゴリのみを監督として、オブジェクト検出の問題に取り組むことを目的としている。
そこで本研究では,各改良モジュールの監督期間中に,基幹クラス,背景,あるいは無視されるボックスの選択基準を動的に変更する適応型監視アグリゲーション機能を提案する。
論文 参考訳(メタデータ) (2020-04-23T02:49:40Z) - Incremental Object Detection via Meta-Learning [77.55310507917012]
本稿では,段階的タスク間の情報を最適に共有するように,モデル勾配を再形成するメタラーニング手法を提案する。
既存のメタ学習法と比較して,本手法はタスク非依存であり,オブジェクト検出のための高容量モデルに新たなクラスやスケールを段階的に追加することができる。
論文 参考訳(メタデータ) (2020-03-17T13:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。