論文の概要: Multi-Task Incremental Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2002.05347v3
- Date: Wed, 18 Nov 2020 20:31:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 13:21:12.562913
- Title: Multi-Task Incremental Learning for Object Detection
- Title(参考訳): 物体検出のためのマルチタスクインクリメンタル学習
- Authors: Xialei Liu, Hao Yang, Avinash Ravichandran, Rahul Bhotika, Stefano
Soatto
- Abstract要約: マルチタスクは、知識と計算を共有しながら、複数のタスクを学習する。
古いデータにアクセスせずに漸進的に学習すると、過去の知識を壊滅的に忘れてしまう。
- 参考スコア(独自算出の注目度): 71.57155077119839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-task learns multiple tasks, while sharing knowledge and computation
among them. However, it suffers from catastrophic forgetting of previous
knowledge when learned incrementally without access to the old data. Most
existing object detectors are domain-specific and static, while some are
learned incrementally but only within a single domain. Training an object
detector incrementally across various domains has rarely been explored. In this
work, we propose three incremental learning scenarios across various domains
and categories for object detection. To mitigate catastrophic forgetting,
attentive feature distillation is proposed to leverages both bottom-up and
top-down attentions to extract important information for distillation. We then
systematically analyze the proposed distillation method in different scenarios.
We find out that, contrary to common understanding, domain gaps have smaller
negative impact on incremental detection, while category differences are
problematic. For the difficult cases, where the domain gaps and especially
category differences are large, we explore three different exemplar sampling
methods and show the proposed adaptive sampling method is effective to select
diverse and informative samples from entire datasets, to further prevent
forgetting. Experimental results show that we achieve the significant
improvement in three different scenarios across seven object detection
benchmark datasets.
- Abstract(参考訳): マルチタスクは、知識と計算を共有しながら、複数のタスクを学習する。
しかし、古いデータにアクセスせずにインクリメンタルに学習すると、過去の知識を壊滅的に忘れてしまう。
既存のオブジェクト検出器のほとんどはドメイン固有で静的だが、一部はインクリメンタルに学習されるが、1つのドメイン内でのみ学習される。
さまざまなドメインでオブジェクト検出器を段階的にトレーニングすることはほとんどない。
本研究では,オブジェクト検出のための様々な領域とカテゴリにまたがる3つのインクリメンタル学習シナリオを提案する。
破滅的忘れを緩和するために, ボトムアップとトップダウンの両方の注意を生かして, 蒸留の重要な情報を抽出する注意的特徴蒸留を提案する。
次に,提案した蒸留法を異なるシナリオで系統的に解析する。
共通理解とは対照的に、ドメインギャップはインクリメンタルな検出に対してよりマイナスの影響が小さいことが分かりました。
ドメインギャップが大きい場合,特にカテゴリ差が大きい場合には,3つの異なるサンプル法を探索し,提案する適応サンプリング法がデータセット全体から多様で有意義なサンプルを選択するのに有効であることを示す。
実験結果から、7つのオブジェクト検出ベンチマークデータセットの3つのシナリオにおいて,大幅な改善が得られた。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Improving Single Domain-Generalized Object Detection: A Focus on Diversification and Alignment [17.485775402656127]
基底検出器は、単一領域の一般化のための既存の手法を良いマージンで上回ることができる。
分類と局所化の両方の出力を考慮して,複数のビューから検出を整列する手法を提案する。
我々のアプローチは検出器非依存であり、単段検出器と二段検出器の両方にシームレスに適用できる。
論文 参考訳(メタデータ) (2024-05-23T12:29:25Z) - Multimodal 3D Object Detection on Unseen Domains [37.142470149311904]
ドメイン適応アプローチは、この問題に対処するために、テストディストリビューションから無注釈のサンプルへのアクセスを前提とします。
マルチモーダル融合および3次元オブジェクト検出のための教師付きコントラスト学習フレームワークであるCLIX$text3D$を提案する。
CLIX$text3D$は、複数のデータセットシフト下での最先端のドメイン一般化性能を示す。
論文 参考訳(メタデータ) (2024-04-17T21:47:45Z) - Few-Shot Object Detection with Sparse Context Transformers [37.106378859592965]
少ないショット検出は、少ないラベル付きデータでトレーニングされたモデルを使用してオブジェクトをローカライズするパターン認識における主要なタスクである。
本稿では,ソース領域におけるオブジェクトの知識を効果的に活用し,対象領域内の少数のトレーニング画像からスパースコンテキストを自動的に学習する新しいスパースコンテキスト変換器を提案する。
提案手法を2つの難易度オブジェクト検出ベンチマークで評価し,提案手法が関連する最先端技術と比較して競合性能を得ることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-02-14T17:10:01Z) - DA-CIL: Towards Domain Adaptive Class-Incremental 3D Object Detection [2.207918236777924]
本稿では,新しい3次元ドメイン適応型クラスインクリメンタルオブジェクト検出フレームワークDA-CILを提案する。
トレーニング分布を多様化する複数の拡張ドメインを構築するために、新しいデュアルドメインコピーペースト拡張法を設計する。
各種データセットを用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-12-05T06:45:27Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Multi-Label Few-Shot Learning for Aspect Category Detection [23.92900196246631]
感情分析におけるアスペクトカテゴリー検出(ACD)は、文中のアスペクトカテゴリを特定することを目的としている。
既存の数発の学習アプローチは、主にシングルラベルの予測に焦点を当てている。
本稿では,プロトタイプネットワークに基づく複数ラベルの複数ショット学習手法を提案する。
論文 参考訳(メタデータ) (2021-05-29T01:56:11Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z) - Few-shot Learning for Multi-label Intent Detection [59.66787898744991]
State-of-the-art work estimates label-instancelevance scores and using threshold to select multiple associated intent labels。
2つのデータセットの実験により、提案モデルが1ショットと5ショットの両方の設定において強いベースラインを著しく上回ることが示された。
論文 参考訳(メタデータ) (2020-10-11T14:42:18Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。