論文の概要: Few Shot Semantic Segmentation: a review of methodologies and open
challenges
- arxiv url: http://arxiv.org/abs/2304.05832v1
- Date: Wed, 12 Apr 2023 13:07:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 15:01:42.486124
- Title: Few Shot Semantic Segmentation: a review of methodologies and open
challenges
- Title(参考訳): シュートセマンティックセマンティックセグメンテーション : 方法論とオープン課題のレビュー
- Authors: Nico Catalano, Matteo Matteucci
- Abstract要約: Few-Shot Learningでは、モデルがいくつかのサンプルから新しいタスクを学ぶことができる。
Deep Neural Networksはセマンティックセグメンテーションにおいて高い精度を達成したが、大規模なトレーニングデータセットを必要としている。
一部のドメインは、希少性、プライバシー上の懸念、熟練したアノテータの必要性により、そのようなデータセットを構築するのに苦労している。
- 参考スコア(独自算出の注目度): 9.413131350284083
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation assigns category labels to each pixel in an image,
enabling breakthroughs in fields such as autonomous driving and robotics. Deep
Neural Networks have achieved high accuracies in semantic segmentation but
require large training datasets. Some domains have difficulties building such
datasets due to rarity, privacy concerns, and the need for skilled annotators.
Few-Shot Learning (FSL) has emerged as a new research stream that allows models
to learn new tasks from a few samples. This contribution provides an overview
of FSL in semantic segmentation (FSS), proposes a new taxonomy, and describes
current limitations and outlooks.
- Abstract(参考訳): セマンティックセグメンテーションは画像の各ピクセルにカテゴリラベルを割り当て、自動運転やロボティクスといった分野におけるブレークスルーを可能にする。
Deep Neural Networksはセマンティックセグメンテーションにおいて高い精度を達成したが、大規模なトレーニングデータセットを必要としている。
一部のドメインは、希少性、プライバシー上の懸念、熟練したアノテータの必要性により、そのようなデータセットを構築するのに苦労している。
few-shot learning (fsl)は、モデルがいくつかのサンプルから新しいタスクを学習できる新しい研究ストリームとして登場した。
この貢献は、意味的セグメンテーション(FSS)におけるFSLの概要を提供し、新しい分類法を提案し、現在の限界と展望を説明する。
関連論文リスト
- Weakly-Supervised Semantic Segmentation with Image-Level Labels: from
Traditional Models to Foundation Models [33.690846523358836]
弱教師付きセマンティックセマンティックセグメンテーション(WSSS)はピクセルレベルのラベルを避ける効果的なソリューションである。
私たちは、WSSSの最も難しい形態であるイメージレベルのラベルによるWSSSに焦点を当てています。
本稿では,WSSS の文脈において,Segment Anything Model (SAM) などの視覚基盤モデルの適用性について検討する。
論文 参考訳(メタデータ) (2023-10-19T07:16:54Z) - Exploring Open-Vocabulary Semantic Segmentation without Human Labels [76.15862573035565]
我々は、既存の事前学習された視覚言語モデル(VL)を利用して意味的セグメンテーションモデルを訓練するZeroSegを提案する。
ZeroSegは、VLモデルで学んだ視覚概念をセグメントトークンの集合に蒸留することでこれを克服し、それぞれが対象画像の局所化領域を要約する。
提案手法は,他のゼロショットセグメンテーション法と比較して,同じトレーニングデータを用いた場合と比較して,最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T08:47:06Z) - IFSeg: Image-free Semantic Segmentation via Vision-Language Model [67.62922228676273]
目的は,対象のセマンティックなカテゴリの集合にのみ依存するセマンティックセマンティックセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなタスクを実現することである。
本研究では、ランダムな意味圏の2次元マップと、対応する単語トークンの別のマップを作成することで、この人工的なトレーニングデータを構築する。
本モデルでは,本課題の効果的なベースラインを確立するだけでなく,既存手法と比較して高い性能を示す。
論文 参考訳(メタデータ) (2023-03-25T08:19:31Z) - Semantic Image Segmentation: Two Decades of Research [22.533249554532322]
本書はセマンティックイメージセグメンテーション(SiS)分野における20年間の研究成果をまとめたものである。
本稿では,近年のトランスフォーマーの利用動向を含む,最近のディープラーニング手法の概要を紹介する。
我々は、マルチドメイン学習、ドメイン一般化、ドメインインクリメンタル学習、テスト時間適応、ソースフリードメイン適応といった新しいトレンドを明らかにした。
論文 参考訳(メタデータ) (2023-02-13T14:11:05Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Object discovery and representation networks [78.16003886427885]
本研究では,事前に符号化された構造を自ら発見する自己教師型学習パラダイムを提案する。
Odinはオブジェクト発見と表現ネットワークを結合して意味のある画像のセグメンテーションを発見する。
論文 参考訳(メタデータ) (2022-03-16T17:42:55Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - A Pixel-Level Meta-Learner for Weakly Supervised Few-Shot Semantic
Segmentation [40.27705176115985]
Few-shotのセマンティックセマンティックセグメンテーションは、興味のある新しいクラスのために、地上の真実のピクセルレベルのラベルを持つ少数の画像しか利用できない学習タスクに対処する。
限られたデータとその意味ラベルから擬似画素レベルのセグメンテーションマスクを予測するメタラーニングフレームワークを提案する。
提案する学習モデルは,画素レベルのメタラーナーとみなすことができる。
論文 参考訳(メタデータ) (2021-11-02T08:28:11Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Semi-supervised few-shot learning for medical image segmentation [21.349705243254423]
大規模な注釈付きデータセットの必要性を緩和する最近の試みは、数ショットの学習パラダイムの下でトレーニング戦略を開発した。
セマンティックセグメンテーションのための新しい数発の学習フレームワークを提案し,各エピソードでラベルのない画像も利用できるようにした。
エピソードトレーニングにおけるラベルなしのサロゲートタスクを含めると、より強力な特徴表現がもたらされることを示す。
論文 参考訳(メタデータ) (2020-03-18T20:37:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。