論文の概要: CSL: Class-Agnostic Structure-Constrained Learning for Segmentation
Including the Unseen
- arxiv url: http://arxiv.org/abs/2312.05538v2
- Date: Thu, 8 Feb 2024 17:20:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 18:46:21.230466
- Title: CSL: Class-Agnostic Structure-Constrained Learning for Segmentation
Including the Unseen
- Title(参考訳): csl:unseenを含むセグメンテーションのためのクラス非依存構造制約学習
- Authors: Hao Zhang, Fang Li, Lu Qi, Ming-Hsuan Yang, and Narendra Ahuja
- Abstract要約: クラス非依存構造制約学習(Class-Agnostic Structure-Constrained Learning)は、既存のメソッドと統合可能なプラグインフレームワークである。
OODオブジェクトセグメンテーションを強化するソフトアサインとマスク分割手法を提案する。
実証的な評価は、OODセグメンテーション、ZS3、DAセグメンテーションにまたがる既存のアルゴリズムの性能を向上させるCSLの進歩を示している。
- 参考スコア(独自算出の注目度): 62.72636247006293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Addressing Out-Of-Distribution (OOD) Segmentation and Zero-Shot Semantic
Segmentation (ZS3) is challenging, necessitating segmenting unseen classes.
Existing strategies adapt the class-agnostic Mask2Former (CA-M2F) tailored to
specific tasks. However, these methods cater to singular tasks, demand training
from scratch, and we demonstrate certain deficiencies in CA-M2F, which affect
performance. We propose the Class-Agnostic Structure-Constrained Learning
(CSL), a plug-in framework that can integrate with existing methods, thereby
embedding structural constraints and achieving performance gain, including the
unseen, specifically OOD, ZS3, and domain adaptation (DA) tasks. There are two
schemes for CSL to integrate with existing methods (1) by distilling knowledge
from a base teacher network, enforcing constraints across training and
inference phrases, or (2) by leveraging established models to obtain per-pixel
distributions without retraining, appending constraints during the inference
phase. We propose soft assignment and mask split methodologies that enhance OOD
object segmentation. Empirical evaluations demonstrate CSL's prowess in
boosting the performance of existing algorithms spanning OOD segmentation, ZS3,
and DA segmentation, consistently transcending the state-of-art across all
three tasks.
- Abstract(参考訳): Out-Of-Distribution (OOD) Segmentation と Zero-Shot Semantic Segmentation (ZS3) の対応は難しい。
既存の戦略はクラスに依存しない mask2former (ca-m2f) を特定のタスクに適応させる。
しかし、これらの手法は特異なタスクに対応し、スクラッチからの要求訓練を行い、性能に影響を及ぼすCA-M2Fの欠陥を示す。
本稿では,既存の手法と統合可能なプラグインフレームワークであるcsl(class-dependent structure-constrained learning)を提案し,unseen,特にood,zs3,ドメイン適応(da)タスクを含む,構造的制約を組み込んでパフォーマンス向上を実現する。
CSLは,(1)基本教師ネットワークから知識を抽出し,トレーニングや推論フレーズ間の制約を強制すること,(2)既存のモデルを活用して,推論フェーズ中に制約を付加すること,の2つの方法を統合する。
OODオブジェクトセグメンテーションを強化するソフトアサインとマスク分割手法を提案する。
実証的な評価は、CSLがOODセグメンテーション、ZS3、DAセグメンテーションにまたがる既存のアルゴリズムの性能向上に成功し、3つのタスクすべてにわたって最先端を一貫して超越していることを示している。
関連論文リスト
- PosSAM: Panoptic Open-vocabulary Segment Anything [58.72494640363136]
PosSAMはオープン・ボキャブラリ・パノプティ・セグメンテーション・モデルであり、Segment Anything Model(SAM)の強みを、エンドツーエンドのフレームワークで視覚ネイティブのCLIPモデルと統合する。
本稿では,マスクの質を適応的に向上し,各画像の推論中にオープン語彙分類の性能を高めるマスク対応選択組立アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-14T17:55:03Z) - Task-Specific Adaptation of Segmentation Foundation Model via Prompt Learning [7.6136466242670435]
本稿では,Segment Anything Model(SAM)に適合した即時学習によるセグメンテーション基礎モデルのタスク固有適応を提案する。
本手法は,入力プロンプトを組込み空間に調整し,目的タスクの特異性に適合させるプロンプト学習モジュールを含む。
様々なセグメンテーションシナリオに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-03-14T09:13:51Z) - Weakly Supervised Co-training with Swapping Assignments for Semantic Segmentation [21.345548821276097]
クラスアクティベーションマップ(CAM)は通常、擬似ラベルを生成するために弱教師付きセマンティックセマンティックセグメンテーション(WSSS)で使用される。
我々は、ガイド付きCAMを組み込んだエンドツーエンドWSSSモデルを提案し、CAMをオンラインで同時最適化しながらセグメンテーションモデルを訓練する。
CoSAは、追加の監督を持つものを含む、既存のマルチステージメソッドをすべて上回る、最初のシングルステージアプローチである。
論文 参考訳(メタデータ) (2024-02-27T21:08:23Z) - Semantic Connectivity-Driven Pseudo-labeling for Cross-domain
Segmentation [89.41179071022121]
自己学習はドメイン間セマンティックセグメンテーションにおいて一般的なアプローチである。
本稿ではセマンティック・コネクティビティ駆動の擬似ラベル方式を提案する。
このアプローチは、接続レベルにおいて擬似ラベルを定式化し、構造的および低雑音のセマンティクスの学習を容易にする。
論文 参考訳(メタデータ) (2023-12-11T12:29:51Z) - AIMS: All-Inclusive Multi-Level Segmentation [93.5041381700744]
視覚領域を3つのレベル(パート、エンティティ、リレーション)に分割するタスクであるAll-Inclusive Multi-Level(AIMS)を提案する。
また、アノテーションの不整合とタスク相関の2つの大きな課題に対処するために、マルチデータセットのマルチタスクトレーニングを通じて統合されたAIMSモデルを構築します。
論文 参考訳(メタデータ) (2023-05-28T16:28:49Z) - Integrative Few-Shot Learning for Classification and Segmentation [37.50821005917126]
少数ショット分類とセグメンテーション(FS-CS)の統合タスクについて紹介する。
FS-CSは、ターゲットクラスがいくつかの例で与えられるとき、クエリイメージでターゲットオブジェクトを分類し、セグメントすることを目的としている。
本稿では,FS-CSのための統合的数ショット学習フレームワークを提案し,学習者がクラスワイドな前景マップを構築するように訓練する。
論文 参考訳(メタデータ) (2022-03-29T16:14:40Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - SASO: Joint 3D Semantic-Instance Segmentation via Multi-scale Semantic
Association and Salient Point Clustering Optimization [8.519716460338518]
セグメンテーションタスクとインスタンスセグメンテーションタスクを共同で行う,SASOという新しい3Dポイントクラウドセグメンテーションフレームワークを提案する。
空間的文脈におけるオブジェクト間の固有相関から着想を得たセグメンテーションタスクに対して,マルチスケールセマンティックアソシエーション(MSA)モジュールを提案する。
例えば、推論手順のみでクラスタリングを利用する以前の作業とは異なるセグメンテーションタスクでは、Salient Point Clustering Optimization (SPCO) モジュールを提案する。
論文 参考訳(メタデータ) (2020-06-25T08:55:25Z) - Generalized Zero-Shot Learning Via Over-Complete Distribution [79.5140590952889]
そこで本稿では,CVAE (Conditional Variational Autoencoder) を用いたOCD(Over-Complete Distribution) の生成を提案する。
フレームワークの有効性は,Zero-Shot LearningプロトコルとGeneralized Zero-Shot Learningプロトコルの両方を用いて評価する。
論文 参考訳(メタデータ) (2020-04-01T19:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。