論文の概要: FuTCR: Future-Targeted Contrast and Repulsion for Continual Panoptic Segmentation
- arxiv url: http://arxiv.org/abs/2605.12451v2
- Date: Mon, 18 May 2026 15:31:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:45.790428
- Title: FuTCR: Future-Targeted Contrast and Repulsion for Continual Panoptic Segmentation
- Title(参考訳): FuTCR : 連続的パノプティカルセグメンテーションのための将来目標コントラストと反発
- Authors: Nicholas Ikechukwu, Keanu Nichols, Deepti Ghadiyaram, Bryan A. Plummer,
- Abstract要約: 新しいクラスが導入される前に表現を再構成するフレームワークを提案する。
FuTCRは、最先端のパノプティクスを最大28%改善する。
- 参考スコア(独自算出の注目度): 25.83154341103521
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Continual Panoptic Segmentation (CPS) requires methods that can quickly adapt to new categories over time. The nature of this dense prediction task means that training images may contain a mix of labeled and unlabeled objects. As nothing is known about these unlabeled objects a priori, existing methods often simply group any unlabeled pixel into a single "background" class during training. In effect, during training, they repeatedly tell the model that all the different background categories are the same (even when they aren't). This makes learning to identify different background categories as they are added challenging since these new categories may require using information the model was previously told was unimportant and ignored. Thus, we propose a Future-Targeted Contrastive and Repulsive (FuTCR) framework that addresses this limitation by restructuring representations before new classes are introduced. FuTCR first discovers confident future-like regions by grouping model-predicted masks whose pixels are consistently classified as background but exhibit non-background logits. Next, FuTCR applies pixel-to-region contrast to build coherent prototypes from these unlabeled regions, while simultaneously repelling background features away from known-class prototypes to explicitly reserve representational space for future categories. Experiments across six CPS settings and a range of dataset sizes show FuTCR improves relative new-class panoptic quality over the state-of-the-art by up to 28%, while preserving or improving base-class performance with gains up to 4%.
- Abstract(参考訳): CPS(Continuous Panoptic Segmentation)は、時間とともに新しいカテゴリに迅速に適応できる手法である。
この密集した予測タスクの性質は、トレーニング画像がラベル付けされたオブジェクトとラベル付けされていないオブジェクトの混合を含む可能性があることを意味する。
これらのラベル付けされていないオブジェクトについて何も知られていないため、既存のメソッドはトレーニング中に任意のラベル付けされていないピクセルを単一の"バックグラウンド"クラスにグループ化する。
実際には、トレーニング中は、異なるバックグラウンドカテゴリがすべて同じである(そうでなくても)ことをモデルに繰り返し伝えます。
これらの新しいカテゴリでは、以前に言われたモデルが重要で無視された情報を使用する必要がある可能性があるため、異なる背景カテゴリを識別する学習が困難になる。
そこで我々は,新しいクラスが導入される前に表現を再構成することで,この制限に対処するFuTCR(Future-Targeted Contrastive and Repulsive)フレームワークを提案する。
FuTCRはまず、背景として一貫して分類されるが、背景にないロジットを示すモデル予測マスクをグループ化することによって、将来的な領域の確実性を発見する。
次に、FuTCRは、これらのラベルのない領域からコヒーレントなプロトタイプを構築するためにピクセル対領域のコントラストを適用し、同時に、既知のクラスプロトタイプから背景機能を排除し、将来のカテゴリの表現空間を明示的に予約する。
6つのCPS設定とさまざまなデータセットサイズにわたる実験によると、FuTCRは、最先端のパノライト品質を最大28%向上させ、ベースクラスのパフォーマンスを最大4%向上させる。
関連論文リスト
- BACS: Background Aware Continual Semantic Segmentation [15.821935479975343]
自律運転では、デプロイされたエージェントの運用環境がより複雑になるにつれて、新しいクラスを統合する必要がある。
アノテーションの効率を高めるために、理想的には、新しいクラスに属するピクセルだけが注釈付けされる。
本稿では,以前に観測されたクラスを検出するための後方背景シフト検出器(BACS)を提案する。
論文 参考訳(メタデータ) (2024-04-19T19:25:26Z) - DiffusePast: Diffusion-based Generative Replay for Class Incremental
Semantic Segmentation [73.54038780856554]
クラスインクリメンタルセマンティック(CISS)は、新たに追加されたクラスを漸進的に学習することで、従来のセグメンテーションタスクを拡張する。
これは、事前訓練されたGANから生成された古いクラスサンプルを再生するものである。
そこで我々はDiffusePastを提案する。DiffusePastは拡散型生成再生モジュールを特徴とする新しいフレームワークで、異なる命令でより信頼性の高いマスクで意味論的に正確な画像を生成する。
論文 参考訳(メタデータ) (2023-08-02T13:13:18Z) - Evidential Deep Learning for Class-Incremental Semantic Segmentation [15.563703446465823]
クラス増分学習(Class-Incremental Learning)は、以前トレーニングされたニューラルネットワークを新しいクラスに拡張することを目的とした機械学習の課題である。
本稿では、将来的な非相関クラスの特徴クラスタリングを回避しつつ、ラベルのないクラスをモデル化する方法の問題に対処する。
提案手法は,この問題をディリクレ分布の期待値と推定の不確実性に対応する未知のクラス(背景)確率で計算した,別のフォアグラウンドクラス確率に分解する。
論文 参考訳(メタデータ) (2022-12-06T10:13:30Z) - Few-shot Open-set Recognition Using Background as Unknowns [58.04165813493666]
未使用のオープンセット認識は、見知らぬクラスの限られた訓練データしか持たない、目に見える画像と新しい画像の両方を分類することを目的としている。
提案手法は,複数のベースラインより優れるだけでなく,3つのベンチマークで新たな結果が得られた。
論文 参考訳(メタデータ) (2022-07-19T04:19:29Z) - A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained
Vision-language Model [61.58071099082296]
オブジェクト検出やセマンティックセグメンテーションといった、より広範な視覚問題に対して、ゼロショット認識をどのようにうまく機能させるかは定かではない。
本稿では,既訓練の視覚言語モデルであるCLIPを用いて,ゼロショットセマンティックセマンティックセマンティックセマンティクスを構築することを目的とした。
実験結果から, この単純なフレームワークは, 従来の最先端をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-12-29T18:56:18Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - Background Splitting: Finding Rare Classes in a Sea of Background [55.03789745276442]
我々は,少数の稀なカテゴリの画像分類のための,高精度な深層モデルの訓練という現実的な問題に焦点をあてる。
これらのシナリオでは、ほとんどの画像はデータセットの背景カテゴリに属します(データセットの95%は背景です)。
非バランスなデータセットをトレーニングするための標準的な微調整アプローチと最先端アプローチの両方が、この極端な不均衡の存在下で正確な深層モデルを生成していないことを実証する。
論文 参考訳(メタデータ) (2020-08-28T23:05:15Z) - Modeling the Background for Incremental Learning in Semantic
Segmentation [39.025848280224785]
深いアーキテクチャは破滅的な忘れ方に弱い。
本稿では,意味的セグメンテーションの文脈においてこの問題に対処する。
本稿では,このシフトを明示的に考慮した蒸留法に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-03T13:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。