Fugu-MT 論文翻訳(概要): Iterative Few-shot Semantic Segmentation from Image Label Text

論文の概要: Iterative Few-shot Semantic Segmentation from Image Label Text

arxiv url: http://arxiv.org/abs/2303.05646v1
Date: Fri, 10 Mar 2023 01:48:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-13 16:37:57.766352
Title: Iterative Few-shot Semantic Segmentation from Image Label Text
Title（参考訳）: 画像ラベルテキストからの反復的少数ショット意味セグメンテーション
Authors: Haohan Wang, Liang Liu, Wuhao Zhang, Jiangning Zhang, Zhenye Gan, Yabiao Wang, Chengjie Wang, Haoqian Wang
Abstract要約: ほとんどショットのセマンティックセマンティックセマンティクスは、いくつかのサポートイメージのガイダンスで、目に見えないクラスオブジェクトのセマンティクスを学ぶことを目的としている。本稿では、強力な視覚言語モデルCLIPの助けを借りて、粗いマスクを生成するための一般的なフレームワークを提案する。本手法は,野生および珍しいクラスの画像に対して,優れた一般化能力を有する。
参考スコア（独自算出の注目度）: 36.53926941601841
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Few-shot semantic segmentation aims to learn to segment unseen class objects with the guidance of only a few support images. Most previous methods rely on the pixel-level label of support images. In this paper, we focus on a more challenging setting, in which only the image-level labels are available. We propose a general framework to firstly generate coarse masks with the help of the powerful vision-language model CLIP, and then iteratively and mutually refine the mask predictions of support and query images. Extensive experiments on PASCAL-5i and COCO-20i datasets demonstrate that our method not only outperforms the state-of-the-art weakly supervised approaches by a significant margin, but also achieves comparable or better results to recent supervised methods. Moreover, our method owns an excellent generalization ability for the images in the wild and uncommon classes. Code will be available at https://github.com/Whileherham/IMR-HSNet.
Abstract（参考訳）: 少数ショットのセマンティクスセグメンテーションは、わずか数枚のサポートイメージのガイダンスで、目に見えないクラスオブジェクトのセグメンテーションを学ぶことを目的としている。以前の方法のほとんどは、サポートイメージのピクセルレベルラベルに依存している。本稿では,画像レベルのラベルのみを利用できる,より困難な設定に焦点をあてる。本稿では、まず、強力な視覚言語モデルCLIPの助けを借りて粗いマスクを生成するための一般的なフレームワークを提案し、次に、サポートおよびクエリ画像のマスク予測を反復的かつ相互に洗練する。 PASCAL-5iとCOCO-20iデータセットの大規模な実験により、我々の手法は最先端の弱い教師付きアプローチをかなりのマージンで上回るだけでなく、最近の教師付き手法に匹敵する、あるいはより良い結果をもたらすことを示した。さらに,本手法は,野生・珍しいクラスの画像に対して優れた一般化能力を有する。コードはhttps://github.com/whileherham/imr-hsnetで入手できる。

関連論文リスト

Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文参考訳（メタデータ） (2023-09-11T14:32:04Z)
Masked Cross-image Encoding for Few-shot Segmentation [16.445813548503708]
Few-shot segmentation (FSS) は、注釈付き画像の限られた数だけを用いて、未確認クラスのピクセルワイズラベルを推測することを目的とした、密度の高い予測タスクである。本研究では,オブジェクトの詳細を記述した共通視覚特性をキャプチャし,特徴の相互作用を高める双方向画像間の依存関係を学習する,Masked Cross-Image MCEという共同学習手法を提案する。
論文参考訳（メタデータ） (2023-08-22T05:36:39Z)
ISLE: A Framework for Image Level Semantic Segmentation Ensemble [5.137284292672375]
従来のセマンティックセグメンテーションネットワークは、最先端の予測品質に到達するために、大量のピクセル単位のアノテートラベルを必要とする。クラスレベルで異なるセマンティックセグメンテーション手法のセットに「擬似ラベル」のアンサンブルを用いるISLEを提案する。私たちはISLEの個々のコンポーネントよりも2.4%改善しています。
論文参考訳（メタデータ） (2023-03-14T13:36:36Z)
A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained Vision-language Model [61.58071099082296]
オブジェクト検出やセマンティックセグメンテーションといった、より広範な視覚問題に対して、ゼロショット認識をどのようにうまく機能させるかは定かではない。本稿では,既訓練の視覚言語モデルであるCLIPを用いて,ゼロショットセマンティックセマンティックセマンティックセマンティクスを構築することを目的とした。実験結果から, この単純なフレームワークは, 従来の最先端をはるかに上回っていることが明らかとなった。
論文参考訳（メタデータ） (2021-12-29T18:56:18Z)
Semantic Segmentation In-the-Wild Without Seeing Any Segmentation Examples [34.97652735163338]
本稿では,各オブジェクトに対するセマンティックセグメンテーションマスク作成のための新しいアプローチを提案する。本手法は,画像に含まれるクラスカテゴリのイメージレベルラベルを入力として扱う。このステージの出力は、教師付きメソッドが必要とする手動のピクセルレベルラベルの代わりに、ピクセルレベルの擬似ラベルを提供する。
論文参考訳（メタデータ） (2021-12-06T17:32:38Z)
A Pixel-Level Meta-Learner for Weakly Supervised Few-Shot Semantic Segmentation [40.27705176115985]
Few-shotのセマンティックセマンティックセグメンテーションは、興味のある新しいクラスのために、地上の真実のピクセルレベルのラベルを持つ少数の画像しか利用できない学習タスクに対処する。限られたデータとその意味ラベルから擬似画素レベルのセグメンテーションマスクを予測するメタラーニングフレームワークを提案する。提案する学習モデルは,画素レベルのメタラーナーとみなすことができる。
論文参考訳（メタデータ） (2021-11-02T08:28:11Z)
Semantic Segmentation with Generative Models: Semi-Supervised Learning and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文参考訳（メタデータ） (2021-04-12T21:41:25Z)
Semantically Meaningful Class Prototype Learning for One-Shot Image Semantic Segmentation [58.96902899546075]
ワンショットセマンティックイメージセグメンテーションは、1つの注釈付きイメージで新しいクラスのオブジェクト領域を分割することを目的としている。最近の研究では、テスト時に予想される状況を模倣するために、エピソディクストレーニング戦略を採用している。エピソードトレーニングにおいて,マルチクラスラベル情報を活用することを提案する。ネットワークが各カテゴリに対してより意味のある機能を生成するように促すだろう。
論文参考訳（メタデータ） (2021-02-22T12:07:35Z)
Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文参考訳（メタデータ） (2021-02-11T18:54:47Z)
Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文参考訳（メタデータ） (2020-11-25T19:06:26Z)
Few-Shot Semantic Segmentation Augmented with Image-Level Weak Annotations [23.02986307143718]
ショットセマンティックセグメンテーションの最近の進歩は、わずか数ピクセルレベルの注釈付き例によってこの問題に対処している。私たちのキーとなるアイデアは、イメージレベルのラベル付きデータから知識を融合させることで、クラスのより優れたプロトタイプ表現を学ぶことです。画像レベルのアノテーションを統合することで,距離空間におけるクラスプロトタイプ表現を学習するための新しいフレームワークPAIAを提案する。
論文参考訳（メタデータ） (2020-07-03T04:58:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。