論文の概要: Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning
- arxiv url: http://arxiv.org/abs/2002.08098v1
- Date: Wed, 19 Feb 2020 10:32:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 14:13:09.885949
- Title: Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning
- Title(参考訳): 反復親和性学習による弱教師付きセマンティックセグメンテーション
- Authors: Xiang Wang, Sifei Liu, Huimin Ma, Ming-Hsuan Yang
- Abstract要約: 弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
- 参考スコア(独自算出の注目度): 86.45526827323954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-supervised semantic segmentation is a challenging task as no
pixel-wise label information is provided for training. Recent methods have
exploited classification networks to localize objects by selecting regions with
strong response. While such response map provides sparse information, however,
there exist strong pairwise relations between pixels in natural images, which
can be utilized to propagate the sparse map to a much denser one. In this
paper, we propose an iterative algorithm to learn such pairwise relations,
which consists of two branches, a unary segmentation network which learns the
label probabilities for each pixel, and a pairwise affinity network which
learns affinity matrix and refines the probability map generated from the unary
network. The refined results by the pairwise network are then used as
supervision to train the unary network, and the procedures are conducted
iteratively to obtain better segmentation progressively. To learn reliable
pixel affinity without accurate annotation, we also propose to mine confident
regions. We show that iteratively training this framework is equivalent to
optimizing an energy function with convergence to a local minimum. Experimental
results on the PASCAL VOC 2012 and COCO datasets demonstrate that the proposed
algorithm performs favorably against the state-of-the-art methods.
- Abstract(参考訳): 弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
近年の手法では、強い応答を持つ領域を選択してオブジェクトをローカライズするための分類網を活用している。
しかし、そのような応答マップはスパース情報を提供するが、自然画像の画素間には強い対関係があり、スパースマップをより密に伝播するのに利用できる。
本稿では,各画素のラベル確率を学習する一意セグメンテーションネットワークと,アフィニティ行列を学習し,その一意ネットワークから生成された確率マップを改良する一意アフィニティネットワークとからなる,そのような二項関係を反復的に学習するアルゴリズムを提案する。
次に、ペアワイズネットワークによる洗練された結果を一元ネットワークのトレーニングの監督として使用し、手順を反復的に実行して、より優れたセグメンテーションを段階的に得る。
正確なアノテーションを使わずに信頼性の高い画素親和性を学習するために,信頼性のある領域のマイニングも提案する。
この枠組みを反復的に訓練することは、局所最小値に収束するエネルギー関数を最適化することと同値であることを示す。
PASCAL VOC 2012とCOCOデータセットの実験結果は,提案アルゴリズムが最先端の手法に対して良好に動作することを示す。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - FuseNet: Self-Supervised Dual-Path Network for Medical Image
Segmentation [3.485615723221064]
FuseNetは、自己教師型セマンティックセグメンテーションのためのデュアルストリームフレームワークである。
クロスモーダル融合技術は、テキストデータを拡張画像に置き換えることで、CLIPの原理を拡張している。
皮膚病変と肺分画データセットの実験により, 本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-22T00:03:16Z) - Label-efficient Segmentation via Affinity Propagation [27.016747627689288]
ラベル効率のよいスパースアノテーションを用いた弱教師付きセグメンテーションは、手間のかかるピクセルワイドラベリングプロセスのコストを削減するために研究の注目を集めている。
親和性モデリングを親和性伝播過程として定式化し、局所的および大域的親和性項を提案して、正確な擬似ラベルを生成する。
計算コストを大幅に削減する効率的なアルゴリズムも開発されている。
論文 参考訳(メタデータ) (2023-10-16T15:54:09Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty
Regularization [73.03956876752868]
我々は、ネットワークがオブジェクトの他の部分に注意を払うことを可能にする、原則的でエンドツーエンドのトレーニング可能なフレームワークを提案する。
具体的には、ミックスアップデータ拡張方式を分類ネットワークに導入し、2つの不確実な正規化項を設計し、ミックスアップ戦略をよりよく扱う。
論文 参考訳(メタデータ) (2020-08-03T21:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。