論文の概要: A Strong Baseline for Generalized Few-Shot Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2211.14126v2
- Date: Mon, 3 Apr 2023 20:35:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 18:26:51.386794
- Title: A Strong Baseline for Generalized Few-Shot Semantic Segmentation
- Title(参考訳): 一般化された少数ショットセマンティクスセグメンテーションのための強固なベースライン
- Authors: Sina Hajimiri, Malik Boudiaf, Ismail Ben Ayed, Jose Dolz
- Abstract要約: 本稿では、簡単なトレーニングプロセスと、容易に最適化可能な推論フェーズを備えた、数発のセグメンテーションフレームワークを提案する。
本稿では,よく知られたInfoMaxの原理に基づいて,学習した特徴表現とそれに対応する予測との相互情報を最大化する,シンプルで効果的なモデルを提案する。
簡単なトレーニングプロセスでは、ベースクラスでトレーニングされたセグメンテーションネットワークの上に推論モデルを適用することができる。
- 参考スコア(独自算出の注目度): 23.19826553671976
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces a generalized few-shot segmentation framework with a
straightforward training process and an easy-to-optimize inference phase. In
particular, we propose a simple yet effective model based on the well-known
InfoMax principle, where the Mutual Information (MI) between the learned
feature representations and their corresponding predictions is maximized. In
addition, the terms derived from our MI-based formulation are coupled with a
knowledge distillation term to retain the knowledge on base classes. With a
simple training process, our inference model can be applied on top of any
segmentation network trained on base classes. The proposed inference yields
substantial improvements on the popular few-shot segmentation benchmarks,
PASCAL-$5^i$ and COCO-$20^i$. Particularly, for novel classes, the improvement
gains range from 7% to 26% (PASCAL-$5^i$) and from 3% to 12% (COCO-$20^i$) in
the 1-shot and 5-shot scenarios, respectively. Furthermore, we propose a more
challenging setting, where performance gaps are further exacerbated. Our code
is publicly available at https://github.com/sinahmr/DIaM.
- Abstract(参考訳): 本稿では,簡単なトレーニングプロセスと最適化の容易な推論フェーズを備えた,一般化されたマイナショットセグメンテーションフレームワークを提案する。
特に、よく知られたInfoMaxの原理に基づいて、学習した特徴表現とそれに対応する予測との相互情報(MI)を最大化する単純なモデルを提案する。
また,MIに基づく定式化から派生した用語は,知識蒸留用語と結合し,基礎クラスにおける知識を保持する。
簡単なトレーニングプロセスでは、ベースクラスでトレーニングされたセグメンテーションネットワークの上に推論モデルを適用することができる。
提案手法は,人気のマイナショットセグメンテーションベンチマークであるpascal-$5^i$とcoco-$20^i$に対して大幅に改善する。
特に新規の授業では、改善率は7%から26%(PASCAL-$5^i$)と3%から12%(COCO-$20^i$)である。
さらに,パフォーマンスギャップがさらに悪化する,より困難な設定を提案する。
私たちのコードはhttps://github.com/sinahmr/DIaM.comで公開されています。
関連論文リスト
- Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [55.96599486604344]
本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。
我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。
提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文 参考訳(メタデータ) (2024-05-01T11:10:24Z) - Enhancing Visual Continual Learning with Language-Guided Supervision [76.38481740848434]
継続的な学習は、モデルが以前獲得した知識を忘れずに新しいタスクを学習できるようにすることを目的としている。
ワンホットラベルが伝達する少ない意味情報は,タスク間の効果的な知識伝達を妨げている,と我々は主張する。
具体的には, PLM を用いて各クラスのセマンティックターゲットを生成し, 凍結し, 監視信号として機能する。
論文 参考訳(メタデータ) (2024-03-24T12:41:58Z) - Mining of Single-Class by Active Learning for Semantic Segmentation [0.0]
我々は,MiSiCAL(Active Learning)パラダイムによる単一クラスのマイニングについて紹介する。
MiSiCALは量と精度の相関を利用して、特定のクラスに関して高性能なモデルを訓練できるデータセットを構築する。
MiSiCALは17110kクラス中150クラスでランダムポリシーを上回り、最強のベースラインは101クラスでのみランダムポリシーを上回ります。
論文 参考訳(メタデータ) (2023-07-18T09:58:15Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - Dense Gaussian Processes for Few-Shot Segmentation [66.08463078545306]
本稿では,高密度ガウス過程(GP)回帰に基づく数発のセグメンテーション法を提案する。
GPの高次元出力空間を学習するために,提案手法のエンドツーエンド学習機能を利用する。
提案手法では,PASCAL-5$i$とCOCO-20$i$のベンチマークで,1ショットと5ショットのFSSをそれぞれ新たな最先端に設定する。
論文 参考訳(メタデータ) (2021-10-07T17:57:54Z) - Prior-Enhanced Few-Shot Segmentation with Meta-Prototypes [32.898636584823215]
Few-shot segmentation (FSS) のパフォーマンスは、エピソードトレーニングとクラスワイドプロトタイプの導入によって広範囲に向上している。
本稿では,これらの制約に対処するために,メタプロトタイプを用いた事前拡張ネットワークを提案する。
PASCAL-5i$とCOCO-20i$では平均IoUスコアが60.79%、41.16%となり,5ショット設定では3.49%,5.64%に向上した。
論文 参考訳(メタデータ) (2021-06-01T15:34:30Z) - Deep Gaussian Processes for Few-Shot Segmentation [66.08463078545306]
少数ショットのセグメンテーションは難しい作業であり、いくつかの注釈付きサンプルから一般化可能な表現を抽出する必要がある。
ガウス過程(GP)回帰に基づく数ショット学習者定式化を提案する。
PASCAL-5i と COCO-20i では mIoU スコアが68.1 と 49.8 である。
論文 参考訳(メタデータ) (2021-03-30T17:56:32Z) - Few-Shot Segmentation Without Meta-Learning: A Good Transductive
Inference Is All You Need? [34.95314059362982]
数ショットのセグメンテーションタスクにおける推論の実行方法が性能に重大な影響を及ぼすことを示す。
与えられたクエリー画像に対するトランスダクティブ推論を導入し、ラベルなし画素の統計情報を活用する。
提案手法は,5分と10秒のシナリオにおいて,最先端よりも約5%と6%の改善をもたらすことを示す。
論文 参考訳(メタデータ) (2020-12-11T07:11:19Z) - Fast Few-Shot Classification by Few-Iteration Meta-Learning [173.32497326674775]
数ショット分類のための高速な最適化に基づくメタラーニング手法を提案する。
我々の戦略はメタ学習において学習すべき基礎学習者の目的の重要な側面を可能にする。
我々は、我々のアプローチの速度と効果を実証し、総合的な実験分析を行う。
論文 参考訳(メタデータ) (2020-10-01T15:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。