論文の概要: Rethinking Alignment and Uniformity in Unsupervised Image Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2211.14513v1
- Date: Sat, 26 Nov 2022 08:43:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 15:31:52.359979
- Title: Rethinking Alignment and Uniformity in Unsupervised Image Semantic
Segmentation
- Title(参考訳): 教師なし画像セマンティックセグメンテーションにおけるアライメントと均一性の再考
- Authors: Daoan Zhang, Chenming Li, Haoquan Li, Wenjian Huang, Lingyun Huang,
Jianguo Zhang
- Abstract要約: 教師なしのイメージセマンティックセグメンテーションは、外部の監督なしに、低レベルの視覚特徴とセマンティックレベルの表現とを一致させることを目的としている。
本稿では,UISSモデルにおける特徴アライメントと特徴均一性の観点から,重要な特性について考察する。
本稿では,セマンティック・アテンション・ネットワーク(SAN)と呼ばれるロバストなネットワークを提案し,セマンティック・アテンション(SEAT)というモジュールを動的に生成する手法を提案する。
- 参考スコア(独自算出の注目度): 5.00167841640205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised image semantic segmentation(UISS) aims to match low-level visual
features with semantic-level representations without outer supervision. In this
paper, we address the critical properties from the view of feature alignments
and feature uniformity for UISS models. We also make a comparison between UISS
and image-wise representation learning. Based on the analysis, we argue that
the existing MI-based methods in UISS suffer from representation collapse. By
this, we proposed a robust network called Semantic Attention Network(SAN), in
which a new module Semantic Attention(SEAT) is proposed to generate pixel-wise
and semantic features dynamically. Experimental results on multiple semantic
segmentation benchmarks show that our unsupervised segmentation framework
specializes in catching semantic representations, which outperforms all the
unpretrained and even several pretrained methods.
- Abstract(参考訳): 教師なし画像セマンティクスセグメンテーション(uiss)は、外部の監督なしに低レベルの視覚特徴と意味レベルの表現をマッチングすることを目的としている。
本稿では,UISSモデルにおける特徴アライメントと特徴均一性の観点から,重要な特性について述べる。
また,UISSと画像表現学習の比較を行った。
本分析に基づき, 既存のMI法は表現崩壊に悩まされていると論じる。
そこで,本稿では,意味的注意(semantic attention network,san)と呼ばれるロバストなネットワークを提案し,新たなモジュールである意味的注意(semantic attention,seat)を提案し,ピクセル毎および意味的特徴を動的に生成する。
複数のセマンティクスセグメンテーションベンチマークの実験結果は、教師なしセグメンテーションフレームワークがセマンティクス表現のキャッチを専門としていることを示している。
関連論文リスト
- EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.476136494434766]
意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。
オブジェクトレベルの表現を画像内および画像間の整合性で学習する。
COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文 参考訳(メタデータ) (2024-03-03T11:24:16Z) - Reflection Invariance Learning for Few-shot Semantic Segmentation [53.20466630330429]
Few-shot semantic segmentation (FSS) は、いくつかのアノテーション付きサポートイメージを持つクエリイメージにおいて、目に見えないクラスのオブジェクトをセグメントすることを目的としている。
本稿では,マルチビューマッチング方式でリフレクション不変性をマイニングするための,新しい数ショットセグメンテーションフレームワークを提案する。
PASCAL-$5textiti$とCOCO-$20textiti$データセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-01T15:14:58Z) - Weakly-supervised segmentation of referring expressions [81.73850439141374]
テキスト基底セマンティックSEGmentationは、ピクセルレベルのアノテーションなしで画像レベルの参照式から直接セグメンテーションマスクを学習する。
提案手法は,PhraseCutおよびRefCOCOデータセット上での表現セグメンテーションを弱教師付きで参照する際の有望な結果を示す。
論文 参考訳(メタデータ) (2022-05-10T07:52:24Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Self-supervised Contrastive Learning for Cross-domain Hyperspectral
Image Representation [26.610588734000316]
本稿では,アノテートが本質的に困難であるハイパースペクトル画像に適した自己教師型学習フレームワークを提案する。
提案するフレームワークアーキテクチャは、クロスドメインCNNを利用して、異なるハイパースペクトル画像から表現を学習する。
実験結果は、スクラッチや他の移動学習法から学習したモデルに対して、提案した自己教師型表現の利点を示す。
論文 参考訳(メタデータ) (2022-02-08T16:16:45Z) - MuSCLe: A Multi-Strategy Contrastive Learning Framework for Weakly
Supervised Semantic Segmentation [39.858844102571176]
弱教師付きセマンティックセグメンテーション(WSSS)は、教師付きセマンティックセグメンテーション(SSS)メソッドで必要とされるピクセルレベルのアノテーションではなく、画像レベルのアノテーションのような弱いラベルに依存している。
本稿では,改良された特徴表現とWSSS性能を向上させるために,新しいマルチストラテジー・コントラスト学習(MuSCLe)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-18T14:38:50Z) - Self-Supervised Learning Disentangled Group Representation as Feature [82.07737719232972]
既存の自己監督学習(SSL)は、回転や着色などの単純な拡張機能のみを分解することを示す。
反復的分割に基づく不変リスク最小化(IP-IRM)を提案する。
我々は、IP-IRMが完全に不整合表現に収束し、様々なベンチマークでその効果を示すことを証明した。
論文 参考訳(メタデータ) (2021-10-28T16:12:33Z) - Dense Semantic Contrast for Self-Supervised Visual Representation
Learning [12.636783522731392]
意味圏決定境界を密度の高いレベルでモデル化するためのDense Semantic Contrast(DSC)を提案する。
本稿では,多粒度表現学習のためのクロスイメージ・セマンティック・コントラッシブ・ラーニング・フレームワークを提案する。
実験結果から,DSCモデルは下流の高密度予測タスクに転送する場合に,最先端の手法よりも優れることがわかった。
論文 参考訳(メタデータ) (2021-09-16T07:04:05Z) - Anti-aliasing Semantic Reconstruction for Few-Shot Semantic Segmentation [66.85202434812942]
セグメンテーションを意味的再構成問題として再検討する。
基本クラスの特徴を,新しいクラス再構築のためのクラスレベルのセマンティック空間にまたがる一連の基底ベクトルに変換する。
提案手法はアンチエイリアス・セマンティック・リストラクション (ASR) と呼ばれ, 数発の学習問題に対して, 体系的かつ解釈可能な解法を提供する。
論文 参考訳(メタデータ) (2021-06-01T02:17:36Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。