論文の概要: Continual Learning for Image Segmentation with Dynamic Query
- arxiv url: http://arxiv.org/abs/2311.17450v1
- Date: Wed, 29 Nov 2023 08:46:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 22:05:34.667913
- Title: Continual Learning for Image Segmentation with Dynamic Query
- Title(参考訳): 動的クエリによる画像分割の連続学習
- Authors: Weijia Wu, Yuzhong Zhao, Zhuang Li, Lianlei Shan, Hong Zhou, Mike
Zheng Shou
- Abstract要約: インクリメンタル・ダイナミック・クエリー(CISDQ)を用いた簡易かつ効果的な連続画像法を提案する。
CISDQは、軽量なクエリ埋め込みによって、古い知識と新しい知識の両方を分離する。
2つのタスクのための3つのデータセットの実験を行い、CISDQが最先端のパフォーマンスを達成することを示す。
- 参考スコア(独自算出の注目度): 38.05316467740918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image segmentation based on continual learning exhibits a critical drop of
performance, mainly due to catastrophic forgetting and background shift, as
they are required to incorporate new classes continually. In this paper, we
propose a simple, yet effective Continual Image Segmentation method with
incremental Dynamic Query (CISDQ), which decouples the representation learning
of both old and new knowledge with lightweight query embedding. CISDQ mainly
includes three contributions: 1) We define dynamic queries with adaptive
background class to exploit past knowledge and learn future classes naturally.
2) CISDQ proposes a class/instance-aware Query Guided Knowledge Distillation
strategy to overcome catastrophic forgetting by capturing the inter-class
diversity and intra-class identity. 3) Apart from semantic segmentation, CISDQ
introduce the continual learning for instance segmentation in which
instance-wise labeling and supervision are considered. Extensive experiments on
three datasets for two tasks (i.e., continual semantic and instance
segmentation are conducted to demonstrate that CISDQ achieves the
state-of-the-art performance, specifically, obtaining 4.4% and 2.9% mIoU
improvements for the ADE 100-10 (6 steps) setting and ADE 100-5 (11 steps)
setting.
- Abstract(参考訳): 連続学習に基づく画像セグメンテーションは,新しいクラスを継続的に組み込む必要があるため,主に破滅的な忘れ込みと背景シフトによって,重要なパフォーマンス低下を示す。
本稿では,新しい知識と古い知識の表現学習を軽量な問合せ埋め込みで分離する,インクリメンタル・ダイナミック・クエリ(cisdq)を用いた,単純かつ効果的な連続的画像分割手法を提案する。
CISDQは主に3つのコントリビューションを含んでいる。
1) 動的クエリを適応型バックグラウンドクラスで定義し,過去の知識を活用し,将来のクラスを自然に学習する。
2)CISDQは,クラス間多様性とクラス内アイデンティティを捉えることで,破滅的な忘れを克服するクラス/インスタンス間クエリガイドド知識蒸留戦略を提案する。
3) セマンティックセグメンテーションは別として,CISDQでは, セマンティックセグメンテーションの継続学習を導入している。
2つのタスクのための3つのデータセット(つまり連続的セマンティクスとインスタンスセグメンテーション)に関する大規模な実験を行い、CISDQが最先端のパフォーマンス、具体的にはADE 100-10(6ステップ)設定とADE 100-5(11ステップ)設定の4.4%と2.9%のmIoU改善を達成することを示した。
関連論文リスト
- Dynamic Feature Learning and Matching for Class-Incremental Learning [20.432575325147894]
CIL(Class-incremental Learning)は,従来のクラスを破滅的に忘れることなく,新しいクラスを学習する方法として登場した。
本稿では,動的特徴学習とマッチング(DFLM)モデルを提案する。
提案手法は既存手法に比べて大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2024-05-14T12:17:19Z) - Feature Decoupling-Recycling Network for Fast Interactive Segmentation [79.22497777645806]
近年のインタラクティブセグメンテーション手法では,入力としてソースイメージ,ユーザガイダンス,従来予測されていたマスクを反復的に取り込んでいる。
本稿では,本質的な相違点に基づいてモデリングコンポーネントを分離するFDRN(Feature Decoupling-Recycling Network)を提案する。
論文 参考訳(メタデータ) (2023-08-07T12:26:34Z) - AIMS: All-Inclusive Multi-Level Segmentation [93.5041381700744]
視覚領域を3つのレベル(パート、エンティティ、リレーション)に分割するタスクであるAll-Inclusive Multi-Level(AIMS)を提案する。
また、アノテーションの不整合とタスク相関の2つの大きな課題に対処するために、マルチデータセットのマルチタスクトレーニングを通じて統合されたAIMSモデルを構築します。
論文 参考訳(メタデータ) (2023-05-28T16:28:49Z) - SCPNet: Semantic Scene Completion on Point Cloud [38.029386594416394]
セマンティックシーン補完のための深層モデル(SSC)の訓練は、スパース入力と不完全入力のために困難である。
マルチスケールな特徴を集約する新しいサブネットワークを設計し、損失の少ないダウンサンプリング操作を不要とする。
そこで本研究では,既設のパノプティクス・セグメンテーション・ラベルを用いて,動的オブジェクトのトレースを除去する簡易かつ効果的なラベル修正手法を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:03:23Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - Spatio-temporal Relation Modeling for Few-shot Action Recognition [100.3999454780478]
本稿では,高次時間表現を同時に学習しながら,クラス固有の特徴の識別性を向上する数ショットアクション認識フレームワークSTRMを提案する。
本手法は,本研究でもっとも優れた手法に比べて,分類精度が3.5%向上した。
論文 参考訳(メタデータ) (2021-12-09T18:59:14Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - CTRN: Class-Temporal Relational Network for Action Detection [7.616556723260849]
エンドツーエンドネットワーク:CTRN(Class-Temporal Network)を導入する。
CTRNには、Transform Representation Module、Class-Temporal Module、G-classifierの3つの重要なコンポーネントが含まれている。
CTRを3つの高密度ラベル付きデータセット上で評価し、最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-26T08:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。