論文の概要: Learning What Not to Segment: A New Perspective on Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2203.07615v1
- Date: Tue, 15 Mar 2022 03:08:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 14:53:17.256250
- Title: Learning What Not to Segment: A New Perspective on Few-Shot Segmentation
- Title(参考訳): セグメンテーションにすべきでないことを学ぶ:Few-Shot Segmentationの新しい視点
- Authors: Chunbo Lang, Gong Cheng, Binfei Tu, Junwei Han
- Abstract要約: 近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
- 参考スコア(独自算出の注目度): 63.910211095033596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently few-shot segmentation (FSS) has been extensively developed. Most
previous works strive to achieve generalization through the meta-learning
framework derived from classification tasks; however, the trained models are
biased towards the seen classes instead of being ideally class-agnostic, thus
hindering the recognition of new concepts. This paper proposes a fresh and
straightforward insight to alleviate the problem. Specifically, we apply an
additional branch (base learner) to the conventional FSS model (meta learner)
to explicitly identify the targets of base classes, i.e., the regions that do
not need to be segmented. Then, the coarse results output by these two learners
in parallel are adaptively integrated to yield precise segmentation prediction.
Considering the sensitivity of meta learner, we further introduce an adjustment
factor to estimate the scene differences between the input image pairs for
facilitating the model ensemble forecasting. The substantial performance gains
on PASCAL-5i and COCO-20i verify the effectiveness, and surprisingly, our
versatile scheme sets a new state-of-the-art even with two plain learners.
Moreover, in light of the unique nature of the proposed approach, we also
extend it to a more realistic but challenging setting, i.e., generalized FSS,
where the pixels of both base and novel classes are required to be determined.
The source code is available at github.com/chunbolang/BAM.
- Abstract(参考訳): 近年では、FSS ( few-shot segmentation) が広く開発されている。
これまでのほとんどの研究は、分類タスクから派生したメタラーニングフレームワークを通じて一般化を図っているが、訓練されたモデルは、理想的にはクラスに依存しないのではなく、見たクラスに偏っているため、新しい概念の認識を妨げる。
本稿では,この問題を解消するための新鮮で分かりやすい洞察を提案する。
具体的には、従来のfssモデル(meta learner)に新たなブランチ(base learner)を適用して、ベースクラスのターゲット、すなわちセグメンテーションを必要としない領域を明示的に識別する。
そして、これら2人の学習者が並列に出力する粗い結果を適応的に統合し、正確なセグメンテーション予測を行う。
さらに,メタ学習者の感性を考慮して,入力画像ペア間のシーン差を推定し,モデルアンサンブル予測を容易にする調整因子を提案する。
PASCAL-5i と COCO-20i の大幅な性能向上は有効性を検証するものであり、我々の多目的スキームは2人の素人学習者でさえ新しい最先端の手法を定めている。
さらに,提案手法のユニークな性質に照らして,ベースクラスと新規クラスの双方の画素が決定されるような,より現実的で挑戦的な設定,すなわち一般化されたfsにも拡張する。
ソースコードはgithub.com/chunbolang/BAMで入手できる。
関連論文リスト
- Prototypical Kernel Learning and Open-set Foreground Perception for
Generalized Few-shot Semantic Segmentation [7.707161030443157]
Generalized Few-shot Semantic (GFSS)は、Few-shot Semanticアグリゲーションを拡張して、未確認のクラスと評価中のクラスを分割する。
上記の問題に対して,原型的カーネル学習とオープンセット認識を融合させることで対処する。
さらに、条件バイアスに基づく推論と協調する前景文脈知覚モジュールを採用し、クラス非依存およびオープンセット前景検出を行う。
論文 参考訳(メタデータ) (2023-08-09T13:38:52Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - DiGeo: Discriminative Geometry-Aware Learning for Generalized Few-Shot
Object Detection [39.937724871284665]
汎用的な少ショットオブジェクト検出は、豊富なアノテーションと限られたトレーニングデータを持つ新しいクラスで、両方のベースクラス上で正確な検出を実現することを目的としている。
既存のアプローチは、ベースクラスのパフォーマンスを犠牲にして、数ショットの一般化を促進する。
クラス間分離とクラス内コンパクト性の幾何学的特徴を学習するための新しいトレーニングフレームワークDiGeoを提案する。
論文 参考訳(メタデータ) (2023-03-16T22:37:09Z) - Activating the Discriminability of Novel Classes for Few-shot
Segmentation [48.542627940781095]
本稿では,特徴符号化段階とセグメンテーションの予測段階の両方において,新規クラスの識別可能性を明示的に活性化することを提案する。
セグメンテーションの予測段階では、クエリ画像の高信頼画素を用いて自分自身を洗練できる自己修正オンラインフォアグラウンド分類器(SROFB)を学習する。
論文 参考訳(メタデータ) (2022-12-02T12:22:36Z) - Adaptive Fine-Grained Sketch-Based Image Retrieval [100.90633284767205]
最近のファイングレード・スケッチに基づく画像検索は、モデルから新しいカテゴリへの一般化へとシフトしている。
実世界のアプリケーションでは、トレーニングされたFG-SBIRモデルは、新しいカテゴリと異なる人間のスケッチラーの両方に適用されることが多い。
モデルに依存しないメタラーニング(MAML)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-04T21:07:20Z) - Class-Incremental Learning with Strong Pre-trained Models [97.84755144148535]
CIL(Class-incremental Learning)は、少数のクラス(ベースクラス)から始まる設定で広く研究されている。
我々は、多数のベースクラスで事前訓練された強力なモデルから始まるCILの実証済み実世界の設定について検討する。
提案手法は、解析されたCIL設定すべてに頑健で一般化されている。
論文 参考訳(メタデータ) (2022-04-07T17:58:07Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z) - Fine-grained Angular Contrastive Learning with Coarse Labels [72.80126601230447]
教師付きおよび自己監督型コントラスト前訓練を効果的に組み合わせることができる新しい「Angularの正規化」モジュールを紹介します。
この研究は、C2FS分類のこの新しい、挑戦的で、非常に実用的なトピックに関する将来の研究の道を開くのに役立ちます。
論文 参考訳(メタデータ) (2020-12-07T08:09:02Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。