論文の概要: CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation
- arxiv url: http://arxiv.org/abs/2502.17429v1
- Date: Mon, 24 Feb 2025 18:58:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:53:50.016549
- Title: CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation
- Title(参考訳): CLIMB-3D: 不均衡な3次元インスタンスセグメンテーションのための継続的な学習
- Authors: Vishal Thengane, Jean Lahoud, Hisham Cholakkal, Rao Muhammad Anwer, Lu Yin, Xiatian Zhu, Salman Khan,
- Abstract要約: 現在の手法は、自然階級の不均衡を伴う時間とともに新しいカテゴリが出現する現実的なシナリオに対処するのに苦労している。
我々はtextbfContinual textbfLearning と textbf3D インスタンスセグメンテーションのためのクラス textbfIm Balance の両方に取り組むためのフレームワークを提案する。
提案手法は,Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Im Balance Correction (IC) moduleである。
- 参考スコア(独自算出の注目度): 67.36817440834251
- License:
- Abstract: While 3D instance segmentation has made significant progress, current methods struggle to address realistic scenarios where new categories emerge over time with natural class imbalance. This limitation stems from existing datasets, which typically feature few well-balanced classes. Although few datasets include unbalanced class annotations, they lack the diverse incremental scenarios necessary for evaluating methods under incremental settings. Addressing these challenges requires frameworks that handle both incremental learning and class imbalance. However, existing methods for 3D incremental segmentation rely heavily on large exemplar replay, focusing only on incremental learning while neglecting class imbalance. Moreover, frequency-based tuning for balanced learning is impractical in these setups due to the lack of prior class statistics. To overcome these limitations, we propose a framework to tackle both \textbf{C}ontinual \textbf{L}earning and class \textbf{Imb}alance for \textbf{3D} instance segmentation (\textbf{CLIMB-3D}). Our proposed approach combines Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Imbalance Correction (IC) module. Unlike prior methods, our framework minimizes ER usage, with KD preventing forgetting and supporting the IC module in compiling past class statistics to balance learning of rare classes during incremental updates. To evaluate our framework, we design three incremental scenarios based on class frequency, semantic similarity, and random grouping that aim to mirror real-world dynamics in 3D environments. Experimental results show that our proposed framework achieves state-of-the-art performance, with an increase of up to 16.76\% in mAP compared to the baseline. Code will be available at: \href{https://github.com/vgthengane/CLIMB3D}{https://github.com/vgthengane/CLIMB3D}
- Abstract(参考訳): 3Dインスタンスのセグメンテーションは大きな進歩を遂げているが、現在の手法では、自然なクラス不均衡を伴う時間とともに新しいカテゴリが出現する現実的なシナリオに対処するのに苦労している。
この制限は、通常はバランスの取れたクラスがほとんどない既存のデータセットに由来する。
アンバランスなクラスアノテーションを含むデータセットは少ないが、インクリメンタルな設定の下でメソッドを評価するのに必要な、多様なインクリメンタルシナリオは欠如している。
これらの課題に対処するには、漸進的な学習とクラス不均衡の両方を扱うフレームワークが必要である。
しかし、既存の3次元インクリメンタルセグメンテーションの手法は、クラス不均衡を無視しながら、インクリメンタルラーニングにのみ焦点をあてる、大規模な模範的なリプレイに大きく依存している。
さらに、これらの設定では、事前クラス統計が欠如しているため、バランスの取れた学習のための周波数ベースのチューニングが不可能である。
これらの制限を克服するために、我々は、 \textbf{C}ontinual \textbf{L}earningと、 \textbf{3D}インスタンスセグメンテーション(\textbf{CLIMB-3D})のクラス \textbf{Imb}alanceの両方に取り組むためのフレームワークを提案する。
提案手法は,Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Im Balance Correction (IC) moduleである。
従来の手法とは異なり、我々のフレームワークはERの使用を最小化し、KDは過去のクラス統計をコンパイルして、漸進的な更新中にレアクラスの学習のバランスをとる際に、ICモジュールを忘れたりサポートしたりするのを防ぐ。
本フレームワークの評価には,3次元環境における実世界の動態のミラー化を目的とした,クラス頻度,意味的類似性,ランダムなグループ化に基づく3つの段階的なシナリオを設計する。
実験の結果,提案フレームワークは,ベースラインに比べてmAPが最大16.766%向上し,最先端性能を実現していることがわかった。
コードは以下の通り。 \href{https://github.com/vgthengane/CLIMB3D}{https://github.com/vgthengane/CLIMB3D}
関連論文リスト
- Covariance-based Space Regularization for Few-shot Class Incremental Learning [25.435192867105552]
FSCIL(Few-shot Class Incremental Learning)では,ラベル付きデータに制限のあるクラスを継続的に学習する必要がある。
インクリメンタルセッションにおける限られたデータのため、モデルは新しいクラスを過度に適合させ、ベースクラスの破滅的な忘れを苦しむ傾向にある。
最近の進歩は、基本クラス分布を制約し、新しいクラスの識別的表現を学習するプロトタイプベースのアプローチに頼っている。
論文 参考訳(メタデータ) (2024-11-02T08:03:04Z) - TeFF: Tracking-enhanced Forgetting-free Few-shot 3D LiDAR Semantic Segmentation [10.628870775939161]
本稿では,LiDARデータの時間的連続性を利用して,現在の数ショットセマンティックセマンティックセマンティクスの限界に対処する。
追跡モデルを用いて、LiDARフレームのシーケンスから擬似地下構造を生成し、新しいクラスで学習するデータセットの能力を向上する。
トレーニング可能なパラメータの数を減らし,新しいクラスへの適応性を向上しつつ,ベースクラス上でのモデル性能を保留するテクニックであるLoRAを取り入れた。
論文 参考訳(メタデータ) (2024-08-28T09:18:36Z) - OrCo: Towards Better Generalization via Orthogonality and Contrast for Few-Shot Class-Incremental Learning [57.43911113915546]
FSCIL(Few-Shot Class-Incremental Learning)は、問題空間を限られたデータで拡張するパラダイムを導入する。
FSCILの手法は、データが漸進的に到着するにつれて、破滅的な忘れ込みの課題に直面している。
表現空間における特徴の直交性と対照的な学習という2つの基本原理に基づいて構築されたOrCoフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T13:30:48Z) - Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.0991686509715]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。
本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。
提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:30:10Z) - Neural Collapse Terminus: A Unified Solution for Class Incremental
Learning and Its Variants [166.916517335816]
本稿では,3つの課題における不整合ジレンマに対する統一解を提案する。
ラベル空間全体の最大等角的クラス間分離を有する固定構造である神経崩壊終端を提案する。
本手法は,データ不均衡やデータ不足にかかわらず,神経崩壊最適度を漸進的に保持する。
論文 参考訳(メタデータ) (2023-08-03T13:09:59Z) - S3C: Self-Supervised Stochastic Classifiers for Few-Shot
Class-Incremental Learning [22.243176199188238]
FSCIL(Few-shot class-incremental Learning)は、既に学習済みのクラスについての知識を忘れずに、ラベル付きサンプルがほとんどない新しいクラスについて徐々に学習することを目的としている。
FSCILには2つの大きな課題がある: (i) 限られたデータ量のために新しいクラスに過度に適合すること、 (ii) 段階的にこれらのクラスからのデータが利用できないために古いクラスを破滅的に忘れること。
論文 参考訳(メタデータ) (2023-07-05T12:41:46Z) - Constrained Few-shot Class-incremental Learning [14.646083882851928]
古いクラスの知識を忘れずに新しいデータから新しいクラスを継続的に学習することは、非常に難しい研究課題である。
本稿では,C-FSCILを提案する。C-FSCILは,凍結したメタ学習特徴抽出器,トレーニング可能な固定サイズ全接続層,動的に成長するメモリから構成される。
C-FSCILは3つの更新モードを提供し、新しいクラスを学習する際の正確性と計算メモリコストのトレードオフを提供する。
論文 参考訳(メタデータ) (2022-03-30T18:19:36Z) - Modality-Aware Triplet Hard Mining for Zero-shot Sketch-Based Image
Retrieval [51.42470171051007]
本稿では,ZES-SBIR(Zero-Shot Sketch-Based Image Retrieval)問題に,クロスモダリティメトリック学習の観点から取り組む。
DMLにおける2つの基本的な学習手法、例えば分類訓練とペアトレーニングを組み合わせることで、ZS-SBIRの強力なベースラインを構築した。
モータリティ・アウェア・トリプルト・ハード・マイニング(MATHM)は3種類のペア・ラーニングによってベースラインを向上することを示す。
論文 参考訳(メタデータ) (2021-12-15T08:36:44Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。