論文の概要: Task-Adaptive Feature Transformer for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2010.11437v1
- Date: Thu, 22 Oct 2020 04:35:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 05:11:15.144477
- Title: Task-Adaptive Feature Transformer for Few-Shot Segmentation
- Title(参考訳): 分節化のためのタスク適応型特徴変換器
- Authors: Jun Seo, Young-Hyun Park, Sung-Whan Yoon, Jaekyun Moon
- Abstract要約: タスク適応型特徴変換器 (TAFT) の少数ショットセグメンテーションのための学習可能なモジュールを提案する。
TAFTは、タスク固有の高レベル機能を、セグメンテーションジョブに適したタスクに依存しない一連の特徴に線形に変換する。
PASCAL-$5i$データセットの実験では、この組み合わせがセグメンテーションアルゴリズムに数発の学習機能を追加することに成功している。
- 参考スコア(独自算出の注目度): 21.276981570672064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning allows machines to classify novel classes using only a few
labeled samples. Recently, few-shot segmentation aiming at semantic
segmentation on low sample data has also seen great interest. In this paper, we
propose a learnable module for few-shot segmentation, the task-adaptive feature
transformer (TAFT). TAFT linearly transforms task-specific high-level features
to a set of task-agnostic features well-suited to the segmentation job. Using
this task-conditioned feature transformation, the model is shown to effectively
utilize the semantic information in novel classes to generate tight
segmentation masks. The proposed TAFT module can be easily plugged into
existing semantic segmentation algorithms to achieve few-shot segmentation
capability with only a few added parameters. We combine TAFT with Deeplab V3+,
a well-known segmentation architecture; experiments on the PASCAL-$5^i$ dataset
confirm that this combination successfully adds few-shot learning capability to
the segmentation algorithm, achieving the state-of-the-art few-shot
segmentation performance in some key representative cases.
- Abstract(参考訳): わずかながらの学習により、機械はいくつかのラベル付きサンプルを使用して新しいクラスを分類できる。
近年,低サンプルデータにおける意味的セグメンテーションを指向したショットセグメンテーションも注目されている。
本稿では,タスク適応型特徴変換器 (TAFT) の少数ショットセグメンテーションのための学習可能なモジュールを提案する。
TAFTは、タスク固有の高レベル機能を、セグメンテーションジョブに適したタスクに依存しない一連の特徴に線形変換する。
このタスク条件付き特徴変換を用いて、新しいクラスにおける意味情報を効果的に活用し、タイトなセグメンテーションマスクを生成する。
提案するタフトモジュールは,既存のセマンティクスセグメンテーションアルゴリズムに容易にプラグインできるため,数個のパラメータを追加するだけで,少数ショットセグメンテーション機能を実現することができる。
我々は、TAFTとよく知られたセグメンテーションアーキテクチャであるDeeplab V3+を組み合わせる。PASCAL-$5^i$データセットの実験により、この組み合わせがセグメンテーションアルゴリズムに数発の学習機能を追加し、いくつかの重要なケースで最先端の数発セグメンテーション性能を達成することに成功した。
関連論文リスト
- OMG-Seg: Is One Model Good Enough For All Segmentation? [83.17068644513144]
OMG-Segは、タスク固有のクエリと出力を持つトランスフォーマーベースのエンコーダデコーダアーキテクチャである。
OMG-Segは10以上の異なるセグメンテーションタスクをサポートできるが、計算とパラメータのオーバーヘッドを大幅に削減できることを示す。
論文 参考訳(メタデータ) (2024-01-18T18:59:34Z) - FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation [42.89720785573885]
FreeSegはUnified、Universal、Open-Vocabulary Imageを実現するための汎用フレームワークである。
我々は,FreeSegが3つのセグメンテーションタスクの性能と一般化に新たな成果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-03-30T08:42:49Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - Mask Matching Transformer for Few-Shot Segmentation [71.32725963630837]
Mask Matching Transformer (MM-Former) は、少数ショットセグメンテーションタスクのための新しいパラダイムである。
まず、MM-Formerは、まず分解し、次にブレンドするというパラダイムに従う。
一般的なCOCO-20i$とPascal-5i$ベンチマークに関する広範な実験を行っている。
論文 参考訳(メタデータ) (2022-12-05T11:00:32Z) - ISIM: Iterative Self-Improved Model for Weakly Supervised Segmentation [0.34265828682659694]
Weakly Supervised Semantic Conditional (WSSS)は,クラスレベルのラベルからセグメンテーションラベルを学習するための課題である。
修正エンコーダデコーダに基づくセグメンテーションモデルにおいて,反復的アプローチを用いたフレームワークを提案する。
DeepLabv3とUNetモデルで実施された実験では、Pascal VOC12データセットが大幅に向上している。
論文 参考訳(メタデータ) (2022-11-22T18:14:06Z) - Task-Adaptive Feature Transformer with Semantic Enrichment for Few-Shot
Segmentation [21.276981570672064]
わずかながらの学習により、機械はいくつかのラベル付きサンプルを使用して新しいクラスを分類できる。
本稿では,既存のセグメンテーションネットワーク上に,数発のセグメンテーションを行うための学習可能なモジュールを提案する。
PASCAL-$5i$とCOCO-$20i$データセットの実験では、追加されたモジュールが既存のセグメンテーションの機能を拡張することに成功した。
論文 参考訳(メタデータ) (2022-02-14T06:16:26Z) - CFNet: Learning Correlation Functions for One-Stage Panoptic
Segmentation [46.252118473248316]
バックボーンの特徴を高めるために,まず,異なる場所のセマンティックレベルとインスタンスレベルの相関関係を推定することを提案する。
次に,改良された識別特徴をそれぞれ対応するセグメンテーションヘッドに供給する。
PQは45.1ドル%、ADE20kは32.6ドル%である。
論文 参考訳(メタデータ) (2022-01-13T05:31:14Z) - 3D Meta-Segmentation Neural Network [12.048487830494107]
本稿では,3次元形状分割関数を課題とするメタラーニング手法を提案する。
本手法は,複数の3次元部分分割タスクをトレーニングすることにより,各3次元部分分割関数空間の事前学習を可能にする。
本モデルは,広く使用されているデータセットであるShapeNetの少数ショット設定により,より優れた部分セグメンテーション性能を実現することを実証する。
論文 参考訳(メタデータ) (2021-10-08T01:47:54Z) - Segmenter: Transformer for Semantic Segmentation [79.9887988699159]
セマンティックセグメンテーションのためのトランスフォーマーモデルであるSegmenterを紹介します。
最近のViT(Vision Transformer)上に構築し,セマンティックセグメンテーションに拡張する。
これは、挑戦的なADE20Kデータセット上でのアートの状態を上回り、Pascal ContextとCityscapesでオンパーを実行する。
論文 参考訳(メタデータ) (2021-05-12T13:01:44Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z) - Few-shot Sequence Learning with Transformers [79.87875859408955]
少数のトレーニング例で提供される新しいタスクの学習を目的とした少数のショットアルゴリズム。
本研究では,データポイントがトークンのシーケンスである設定において,少数ショット学習を行う。
トランスフォーマーに基づく効率的な学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-17T12:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。