論文の概要: CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation
- arxiv url: http://arxiv.org/abs/2502.17429v1
- Date: Mon, 24 Feb 2025 18:58:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 22:36:56.738121
- Title: CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation
- Title(参考訳): CLIMB-3D: 不均衡な3次元インスタンスセグメンテーションのための継続的な学習
- Authors: Vishal Thengane, Jean Lahoud, Hisham Cholakkal, Rao Muhammad Anwer, Lu Yin, Xiatian Zhu, Salman Khan,
- Abstract要約: 現在の手法は、自然階級の不均衡を伴う時間とともに新しいカテゴリが出現する現実的なシナリオに対処するのに苦労している。
我々はtextbfContinual textbfLearning と textbf3D インスタンスセグメンテーションのためのクラス textbfIm Balance の両方に取り組むためのフレームワークを提案する。
提案手法は,Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Im Balance Correction (IC) moduleである。
- 参考スコア(独自算出の注目度): 67.36817440834251
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While 3D instance segmentation has made significant progress, current methods struggle to address realistic scenarios where new categories emerge over time with natural class imbalance. This limitation stems from existing datasets, which typically feature few well-balanced classes. Although few datasets include unbalanced class annotations, they lack the diverse incremental scenarios necessary for evaluating methods under incremental settings. Addressing these challenges requires frameworks that handle both incremental learning and class imbalance. However, existing methods for 3D incremental segmentation rely heavily on large exemplar replay, focusing only on incremental learning while neglecting class imbalance. Moreover, frequency-based tuning for balanced learning is impractical in these setups due to the lack of prior class statistics. To overcome these limitations, we propose a framework to tackle both \textbf{C}ontinual \textbf{L}earning and class \textbf{Imb}alance for \textbf{3D} instance segmentation (\textbf{CLIMB-3D}). Our proposed approach combines Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Imbalance Correction (IC) module. Unlike prior methods, our framework minimizes ER usage, with KD preventing forgetting and supporting the IC module in compiling past class statistics to balance learning of rare classes during incremental updates. To evaluate our framework, we design three incremental scenarios based on class frequency, semantic similarity, and random grouping that aim to mirror real-world dynamics in 3D environments. Experimental results show that our proposed framework achieves state-of-the-art performance, with an increase of up to 16.76\% in mAP compared to the baseline. Code will be available at: \href{https://github.com/vgthengane/CLIMB3D}{https://github.com/vgthengane/CLIMB3D}
- Abstract(参考訳): 3Dインスタンスのセグメンテーションは大きな進歩を遂げているが、現在の手法では、自然なクラス不均衡を伴う時間とともに新しいカテゴリが出現する現実的なシナリオに対処するのに苦労している。
この制限は、通常はバランスの取れたクラスがほとんどない既存のデータセットに由来する。
アンバランスなクラスアノテーションを含むデータセットは少ないが、インクリメンタルな設定の下でメソッドを評価するのに必要な、多様なインクリメンタルシナリオは欠如している。
これらの課題に対処するには、漸進的な学習とクラス不均衡の両方を扱うフレームワークが必要である。
しかし、既存の3次元インクリメンタルセグメンテーションの手法は、クラス不均衡を無視しながら、インクリメンタルラーニングにのみ焦点をあてる、大規模な模範的なリプレイに大きく依存している。
さらに、これらの設定では、事前クラス統計が欠如しているため、バランスの取れた学習のための周波数ベースのチューニングが不可能である。
これらの制限を克服するために、我々は、 \textbf{C}ontinual \textbf{L}earningと、 \textbf{3D}インスタンスセグメンテーション(\textbf{CLIMB-3D})のクラス \textbf{Imb}alanceの両方に取り組むためのフレームワークを提案する。
提案手法は,Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Im Balance Correction (IC) moduleである。
従来の手法とは異なり、我々のフレームワークはERの使用を最小化し、KDは過去のクラス統計をコンパイルして、漸進的な更新中にレアクラスの学習のバランスをとる際に、ICモジュールを忘れたりサポートしたりするのを防ぐ。
本フレームワークの評価には,3次元環境における実世界の動態のミラー化を目的とした,クラス頻度,意味的類似性,ランダムなグループ化に基づく3つの段階的なシナリオを設計する。
実験の結果,提案フレームワークは,ベースラインに比べてmAPが最大16.766%向上し,最先端性能を実現していることがわかった。
コードは以下の通り。 \href{https://github.com/vgthengane/CLIMB3D}{https://github.com/vgthengane/CLIMB3D}
関連論文リスト
- ViRN: Variational Inference and Distribution Trilateration for Long-Tailed Continual Representation Learning [6.253882111488726]
ViRNは、変動推論と分布三元化を統合した、堅牢な長期学習のための新しいフレームワークである。
音声(まれな音響イベント、アクセント)や画像タスクを含む6つの長い尾の分類ベンチマークで評価される。
最先端の手法よりも平均精度が10.24%向上する。
論文 参考訳(メタデータ) (2025-07-23T10:04:30Z) - ProtoGuard-guided PROPEL: Class-Aware Prototype Enhancement and Progressive Labeling for Incremental 3D Point Cloud Segmentation [9.578322021478426]
オフラインでトレーニングされたセグメンテーションモデルは、以前見られたクラスを壊滅的に忘れてしまう可能性がある。
ProtoGuard と PROPEL は破滅的忘れの問題に対処するために提案されている。
提案手法は,S3DISデータセットとScanNetデータセットの両方において顕著な結果が得られる。
論文 参考訳(メタデータ) (2025-04-02T11:58:04Z) - InstanceGaussian: Appearance-Semantic Joint Gaussian Representation for 3D Instance-Level Perception [17.530797215534456]
3Dシーンの理解は、自動運転、ロボティクス、拡張現実の応用において重要な研究領域となっている。
本稿では,インスタンスを適応的に集約しながら外観や意味的特徴を共同学習する InstanceGaussian を提案する。
提案手法は,カテゴリーに依存しないオープンボキャブラリ3次元点分割における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-28T16:08:36Z) - Covariance-based Space Regularization for Few-shot Class Incremental Learning [25.435192867105552]
FSCIL(Few-shot Class Incremental Learning)では,ラベル付きデータに制限のあるクラスを継続的に学習する必要がある。
インクリメンタルセッションにおける限られたデータのため、モデルは新しいクラスを過度に適合させ、ベースクラスの破滅的な忘れを苦しむ傾向にある。
最近の進歩は、基本クラス分布を制約し、新しいクラスの識別的表現を学習するプロトタイプベースのアプローチに頼っている。
論文 参考訳(メタデータ) (2024-11-02T08:03:04Z) - TeFF: Tracking-enhanced Forgetting-free Few-shot 3D LiDAR Semantic Segmentation [10.628870775939161]
本稿では,LiDARデータの時間的連続性を利用して,現在の数ショットセマンティックセマンティックセマンティクスの限界に対処する。
追跡モデルを用いて、LiDARフレームのシーケンスから擬似地下構造を生成し、新しいクラスで学習するデータセットの能力を向上する。
トレーニング可能なパラメータの数を減らし,新しいクラスへの適応性を向上しつつ,ベースクラス上でのモデル性能を保留するテクニックであるLoRAを取り入れた。
論文 参考訳(メタデータ) (2024-08-28T09:18:36Z) - Instance Consistency Regularization for Semi-Supervised 3D Instance Segmentation [50.51125319374404]
ラベルのないデータから純粋なインスタンス知識を探索し活用するための,新たな自己学習ネットワークInsTeacher3Dを提案する。
複数の大規模データセットの実験結果から、InsTeacher3Dは最先端の半教師付きアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-06-24T16:35:58Z) - Tendency-driven Mutual Exclusivity for Weakly Supervised Incremental Semantic Segmentation [56.1776710527814]
Weakly Incremental Learning for Semantic (WILSS)は、トレーニング済みのセグメンテーションモデルを利用して、コスト効率と手軽に利用できるイメージレベルのラベルを使用して、新しいクラスをセグメンテーションする。
WILSSを解く最も一般的な方法は、各新しいクラスのシード領域の生成であり、ピクセルレベルの監視の一形態として機能する。
本研究は, 種子領域の挙動を綿密に調整した, 相互排他性に関する革新的, 傾向的関係について提案する。
論文 参考訳(メタデータ) (2024-04-18T08:23:24Z) - OrCo: Towards Better Generalization via Orthogonality and Contrast for Few-Shot Class-Incremental Learning [57.43911113915546]
FSCIL(Few-Shot Class-Incremental Learning)は、問題空間を限られたデータで拡張するパラダイムを導入する。
FSCILの手法は、データが漸進的に到着するにつれて、破滅的な忘れ込みの課題に直面している。
表現空間における特徴の直交性と対照的な学習という2つの基本原理に基づいて構築されたOrCoフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T13:30:48Z) - Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.0991686509715]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。
本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。
提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:30:10Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Neural Collapse Terminus: A Unified Solution for Class Incremental
Learning and Its Variants [166.916517335816]
本稿では,3つの課題における不整合ジレンマに対する統一解を提案する。
ラベル空間全体の最大等角的クラス間分離を有する固定構造である神経崩壊終端を提案する。
本手法は,データ不均衡やデータ不足にかかわらず,神経崩壊最適度を漸進的に保持する。
論文 参考訳(メタデータ) (2023-08-03T13:09:59Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - S3C: Self-Supervised Stochastic Classifiers for Few-Shot
Class-Incremental Learning [22.243176199188238]
FSCIL(Few-shot class-incremental Learning)は、既に学習済みのクラスについての知識を忘れずに、ラベル付きサンプルがほとんどない新しいクラスについて徐々に学習することを目的としている。
FSCILには2つの大きな課題がある: (i) 限られたデータ量のために新しいクラスに過度に適合すること、 (ii) 段階的にこれらのクラスからのデータが利用できないために古いクラスを破滅的に忘れること。
論文 参考訳(メタデータ) (2023-07-05T12:41:46Z) - Boosting Low-Data Instance Segmentation by Unsupervised Pre-training
with Saliency Prompt [103.58323875748427]
この研究は、低データ体制のための新しい教師なし事前学習ソリューションを提供する。
近年のPrompting技術の成功に触発されて,QEISモデルを強化した新しい事前学習手法を導入する。
実験結果から,本手法は3つのデータセット上でのいくつかのQEISモデルを大幅に向上させることが示された。
論文 参考訳(メタデータ) (2023-02-02T15:49:03Z) - Constrained Few-shot Class-incremental Learning [14.646083882851928]
古いクラスの知識を忘れずに新しいデータから新しいクラスを継続的に学習することは、非常に難しい研究課題である。
本稿では,C-FSCILを提案する。C-FSCILは,凍結したメタ学習特徴抽出器,トレーニング可能な固定サイズ全接続層,動的に成長するメモリから構成される。
C-FSCILは3つの更新モードを提供し、新しいクラスを学習する際の正確性と計算メモリコストのトレードオフを提供する。
論文 参考訳(メタデータ) (2022-03-30T18:19:36Z) - Modality-Aware Triplet Hard Mining for Zero-shot Sketch-Based Image
Retrieval [51.42470171051007]
本稿では,ZES-SBIR(Zero-Shot Sketch-Based Image Retrieval)問題に,クロスモダリティメトリック学習の観点から取り組む。
DMLにおける2つの基本的な学習手法、例えば分類訓練とペアトレーニングを組み合わせることで、ZS-SBIRの強力なベースラインを構築した。
モータリティ・アウェア・トリプルト・ハード・マイニング(MATHM)は3種類のペア・ラーニングによってベースラインを向上することを示す。
論文 参考訳(メタデータ) (2021-12-15T08:36:44Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。