論文の概要: Maximize the Exploration of Congeneric Semantics for Weakly Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2110.03982v1
- Date: Fri, 8 Oct 2021 08:59:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-11 13:38:49.367906
- Title: Maximize the Exploration of Congeneric Semantics for Weakly Supervised
Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティクスセグメンテーションのためのコンジェネリックセマンティクスの探索の最大化
- Authors: Ke Zhang, Sihong Chen, Qi Ju, Yong Jiang, Yucong Li, Xin He
- Abstract要約: グラフニューラルネットワーク(P-GNN)を,同一のクラスラベルを含む異なる画像からの自己検出パッチに基づいて構築する。
PASCAL VOC 2012ベンチマークで実験を行い、そのモデルにより最先端の性能が得られた。
- 参考スコア(独自算出の注目度): 27.155133686127474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increase in the number of image data and the lack of corresponding
labels, weakly supervised learning has drawn a lot of attention recently in
computer vision tasks, especially in the fine-grained semantic segmentation
problem. To alleviate human efforts from expensive pixel-by-pixel annotations,
our method focuses on weakly supervised semantic segmentation (WSSS) with
image-level tags, which are much easier to obtain. As a huge gap exists between
pixel-level segmentation and image-level labels, how to reflect the image-level
semantic information on each pixel is an important question. To explore the
congeneric semantic regions from the same class to the maximum, we construct
the patch-level graph neural network (P-GNN) based on the self-detected patches
from different images that contain the same class labels. Patches can frame the
objects as much as possible and include as little background as possible. The
graph network that is established with patches as the nodes can maximize the
mutual learning of similar objects. We regard the embedding vectors of patches
as nodes, and use transformer-based complementary learning module to construct
weighted edges according to the embedding similarity between different nodes.
Moreover, to better supplement semantic information, we propose
soft-complementary loss functions matched with the whole network structure. We
conduct experiments on the popular PASCAL VOC 2012 benchmarks, and our model
yields state-of-the-art performance.
- Abstract(参考訳): 画像データ数の増加と対応するラベルの欠如により,近年,コンピュータビジョン課題,特に細粒度セマンティックセグメンテーション問題において,弱い教師付き学習が注目されている。
高価なピクセル単位のアノテーションから人間の努力を緩和するために、この手法は画像レベルのタグで弱い教師付きセマンティックセグメンテーション(wsss)に焦点を当てている。
ピクセルレベルのセグメンテーションと画像レベルのラベルの間には大きなギャップがあるため、各ピクセルのイメージレベルのセグメンテーション情報をどのように反映するかは重要な問題である。
同じクラスから最大まで、同種意味領域を探索するため、同じクラスラベルを含む異なる画像から自己検出されたパッチに基づいてパッチレベルグラフニューラルネットワーク(P-GNN)を構築した。
パッチは可能な限りオブジェクトをフレーム化でき、最小限のバックグラウンドを含むことができる。
ノードとしてパッチで確立されたグラフネットワークは、類似したオブジェクトの相互学習を最大化することができる。
パッチの埋め込みベクトルをノードとみなし、異なるノード間の埋め込み類似性に応じて、トランスフォーマーベースの補完学習モジュールを用いて重み付きエッジを構築する。
さらに,意味情報を補うために,ネットワーク構造全体と一致するソフト補完的損失関数を提案する。
PASCAL VOC 2012ベンチマークで実験を行い、そのモデルにより最先端の性能が得られた。
関連論文リスト
- Towards Open-Vocabulary Semantic Segmentation Without Semantic Labels [53.8817160001038]
画素レベルの理解にCLIP画像エンコーダを適用する新しい手法であるPixelCLIPを提案する。
セマンティックラベルを使わずにマスクを活用するという課題に対処するため,オンラインクラスタリングアルゴリズムを考案した。
PixelCLIPはCLIPよりも大幅にパフォーマンスが向上し、キャプション管理手法に比べて競合性が向上した。
論文 参考訳(メタデータ) (2024-09-30T01:13:03Z) - Superpixel Semantics Representation and Pre-training for Vision-Language Task [11.029236633301222]
画像空間における粗い粒度のセマンティックな相互作用は無視するべきではない。
本稿では,スーパーピクセルを包括的で堅牢なビジュアルプリミティブとして提案する。
画像全体を細粒度で粗い視覚階層として解析することができる。
論文 参考訳(メタデータ) (2023-10-20T12:26:04Z) - Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文 参考訳(メタデータ) (2023-09-11T14:32:04Z) - A Pixel-Level Meta-Learner for Weakly Supervised Few-Shot Semantic
Segmentation [40.27705176115985]
Few-shotのセマンティックセマンティックセグメンテーションは、興味のある新しいクラスのために、地上の真実のピクセルレベルのラベルを持つ少数の画像しか利用できない学習タスクに対処する。
限られたデータとその意味ラベルから擬似画素レベルのセグメンテーションマスクを予測するメタラーニングフレームワークを提案する。
提案する学習モデルは,画素レベルのメタラーナーとみなすことができる。
論文 参考訳(メタデータ) (2021-11-02T08:28:11Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Exploring Cross-Image Pixel Contrast for Semantic Segmentation [130.22216825377618]
完全教師付きセッティングにおけるセマンティックセグメンテーションのための画素単位のコントラストフレームワークを提案する。
中心となる考え方は、同じセマンティッククラスに属するピクセルの埋め込みを、異なるクラスの埋め込みよりもよく似ているように強制することである。
テスト中に余分なオーバーヘッドを伴わずに既存のセグメンテーションフレームワークに懸命に組み込むことができる。
論文 参考訳(メタデータ) (2021-01-28T11:35:32Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。