Fugu-MT 論文翻訳(概要): Incremental Object Detection with CLIP

論文の概要: Incremental Object Detection with CLIP

arxiv url: http://arxiv.org/abs/2310.08815v1
Date: Fri, 13 Oct 2023 01:59:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-16 14:42:38.303328
Title: Incremental Object Detection with CLIP
Title（参考訳）: CLIPによるインクリメンタルオブジェクト検出
Authors: Yupeng He, Ziyue Huang, Qingjie Liu, Yunhong Wang
Abstract要約: インクリメンタルな検出タスクでは、インクリメンタルな分類タスクとは異なり、ラベル付きバウンディングボックスが異なるため、データのあいまいさが存在する。本稿では,CLIPなどの言語視覚モデルを用いて,異なるクラスセットに対するテキスト特徴埋め込みを生成することを提案する。次に、学習段階の未使用の新規クラスを置き換えるために、幅広いクラスを使用し、実際の段階的なシナリオをシミュレートします。
参考スコア（独自算出の注目度）: 39.85017351940035
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the incremental detection task, unlike the incremental classification task, data ambiguity exists due to the possibility of an image having different labeled bounding boxes in multiple continuous learning stages. This phenomenon often impairs the model's ability to learn new classes. However, the forward compatibility of the model is less considered in existing work, which hinders the model's suitability for incremental learning. To overcome this obstacle, we propose to use a language-visual model such as CLIP to generate text feature embeddings for different class sets, which enhances the feature space globally. We then employ the broad classes to replace the unavailable novel classes in the early learning stage to simulate the actual incremental scenario. Finally, we use the CLIP image encoder to identify potential objects in the proposals, which are classified into the background by the model. We modify the background labels of those proposals to known classes and add the boxes to the training set to alleviate the problem of data ambiguity. We evaluate our approach on various incremental learning settings on the PASCAL VOC 2007 dataset, and our approach outperforms state-of-the-art methods, particularly for the new classes.
Abstract（参考訳）: 漸進的検出タスクでは、インクリメンタルな分類タスクとは異なり、複数の連続的な学習段階においてラベル付き境界ボックスが異なるイメージが存在するため、データのあいまいさが存在する。この現象は、しばしばモデルが新しいクラスを学ぶ能力を妨げる。しかし、モデルの前方互換性は既存の作業では考慮されていないため、漸進的な学習に対するモデルの適合性を妨げている。この課題を克服するために,クリップなどの言語-視覚モデルを用いて,異なるクラス集合に対するテキスト特徴埋め込みを生成することを提案する。次に,未使用の新規クラスを早期学習段階に置き換え,実際のインクリメンタルシナリオをシミュレートするために,幅広いクラスを採用する。最後に、CLIP画像エンコーダを用いて、提案の潜在的なオブジェクトを特定し、モデルによって背景に分類する。これらの提案の背景ラベルを既知のクラスに修正し、トレーニングセットにボックスを追加して、データのあいまいさを軽減します。我々は,PASCAL VOC 2007データセットの様々な漸進的学習設定に対するアプローチを評価し,そのアプローチは,特に新しいクラスにおいて最先端の手法よりも優れていることを示した。

関連論文リスト

Representation Calibration and Uncertainty Guidance for Class-Incremental Learning based on Vision Language Model [22.04660341150286]
クラス増分学習は、新しいクラスの知識を継続的に習得する学習システムを必要とする。 VLM(Vision-Language Models)に基づく現在の手法は、学習タスク間のクラスの違いの問題に悩まされている。ここでは、画像分類のための新しいVLMベースの連続学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-12-10T09:09:23Z)
Class-Independent Increment: An Efficient Approach for Multi-label Class-Incremental Learning [49.65841002338575]
本稿では,MLCIL(Multi-label class-incremental Learning)問題に焦点をあてる。マルチラベルサンプルに対して複数のクラスレベルの埋め込みを抽出する新しいクラス独立インクリメンタルネットワーク(CINet)を提案する。クラス固有のトークンを構築することで、異なるクラスの知識を学び、保存する。
論文参考訳（メタデータ） (2025-03-01T14:40:52Z)
COOLer: Class-Incremental Learning for Appearance-Based Multiple Object Tracking [32.47215340215641]
本稿では,連続学習研究の範囲を,複数物体追跡(MOT)のためのクラス増分学習に拡張する。オブジェクト検出器の連続学習のための従来のソリューションは、外見に基づくトラッカーのデータ関連ステージには対応していない。我々は,Contrastive- and cOntinual-LearningベースのトラッカーであるCOOLerを紹介した。
論文参考訳（メタデータ） (2023-10-04T17:49:48Z)
Cross-Class Feature Augmentation for Class Incremental Learning [45.91253737682168]
本稿では,敵対的攻撃を動機とした機能強化手法を取り入れた新しいクラスインクリメンタルラーニング手法を提案する。提案手法は,任意の対象クラスの特徴を増大させるため,クラスインクリメンタルラーニングにおける従来の知識を活用するためのユニークな視点を持つ。提案手法は,様々なシナリオにおいて,既存の段階的学習手法を著しく上回っている。
論文参考訳（メタデータ） (2023-04-04T15:48:09Z)
Learning Common Rationale to Improve Self-Supervised Representation for Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。 SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文参考訳（メタデータ） (2023-03-03T02:07:40Z)
Few-Shot Class-Incremental Learning by Sampling Multi-Phase Tasks [59.12108527904171]
モデルは新しいクラスを認識し、古いクラスに対する差別性を維持すべきである。古いクラスを忘れずに新しいクラスを認識するタスクは、FSCIL ( few-shot class-incremental Learning) と呼ばれる。我々は,LearnIng Multi-phase Incremental Tasks (LIMIT) によるメタラーニングに基づくFSCILの新しいパラダイムを提案する。
論文参考訳（メタデータ） (2022-03-31T13:46:41Z)
Towards Generalized and Incremental Few-Shot Object Detection [9.033533653482529]
新規なインクリメンタルFew-Shot Object Detection (iFSOD) 法を提案する。具体的には、ベースクラスと新規クラスの特徴表現を分離するために、DBF(Double-Branch Framework)を提案する。我々はPascal VOCとMS-COCOの両方で実験を行い、この手法がインクリメンタル・ショット検出の問題を効果的に解決できることを実証した。
論文参考訳（メタデータ） (2021-09-23T12:38:09Z)
Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文参考訳（メタデータ） (2020-12-31T08:21:37Z)
A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文参考訳（メタデータ） (2020-07-03T18:23:39Z)
Continual Representation Learning for Biometric Identification [47.15075374158398]
本稿では,連続的な表現の学習に焦点をあてた「連続的な表現の学習」という,新たなCL(Continuous Learning)設定を提案する。既存のCL手法が新しい設定での表現を改善することを実証し,提案手法は競合手法よりも優れた結果が得られることを示した。
論文参考訳（メタデータ） (2020-06-08T10:18:06Z)
Incremental Object Detection via Meta-Learning [77.55310507917012]
本稿では,段階的タスク間の情報を最適に共有するように,モデル勾配を再形成するメタラーニング手法を提案する。既存のメタ学習法と比較して,本手法はタスク非依存であり,オブジェクト検出のための高容量モデルに新たなクラスやスケールを段階的に追加することができる。
論文参考訳（メタデータ） (2020-03-17T13:40:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。