論文の概要: Unsupervised Image Semantic Segmentation through Superpixels and Graph
Neural Networks
- arxiv url: http://arxiv.org/abs/2210.11810v1
- Date: Fri, 21 Oct 2022 08:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 15:10:04.635836
- Title: Unsupervised Image Semantic Segmentation through Superpixels and Graph
Neural Networks
- Title(参考訳): スーパーピクセルとグラフニューラルネットワークによる教師なし画像セマンティクスセグメンテーション
- Authors: Moshe Eliasof, Nir Ben Zikri, Eran Treister
- Abstract要約: ラベル付きデータが不足している多くの実世界のシナリオでは、教師なしのイメージセグメンテーションが重要なタスクである。
本稿では,相互情報最大化(MIM),ニューラルスーパーピクセル,グラフニューラルネットワーク(GNN)をエンドツーエンドに組み合わせて,教師なし学習の最近の進歩を活用する新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 6.123324869194195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised image segmentation is an important task in many real-world
scenarios where labelled data is of scarce availability. In this paper we
propose a novel approach that harnesses recent advances in unsupervised
learning using a combination of Mutual Information Maximization (MIM), Neural
Superpixel Segmentation and Graph Neural Networks (GNNs) in an end-to-end
manner, an approach that has not been explored yet. We take advantage of the
compact representation of superpixels and combine it with GNNs in order to
learn strong and semantically meaningful representations of images.
Specifically, we show that our GNN based approach allows to model interactions
between distant pixels in the image and serves as a strong prior to existing
CNNs for an improved accuracy. Our experiments reveal both the qualitative and
quantitative advantages of our approach compared to current state-of-the-art
methods over four popular datasets.
- Abstract(参考訳): ラベル付きデータの可用性が低い現実のシナリオでは、教師なしの画像分割は重要なタスクである。
本稿では, 相互情報最大化(mim), ニューラルスーパーピクセルセグメンテーション, グラフニューラルネットワーク(gnns)の組み合わせを用いた教師なし学習の最近の進歩を, エンドツーエンドで活用する新しい手法を提案する。
スーパーピクセルのコンパクトな表現を活用し,それをGNNと組み合わせることで,画像の強靭で意味のある表現を学習する。
具体的には、GNNベースのアプローチにより、画像中の遠方画素間の相互作用をモデル化し、既存のCNNに先立って強力に機能し、精度を向上できることを示す。
実験により,4つの一般的なデータセット上での現在の最先端手法と比較して,我々のアプローチの質的・定量的優位性を明らかにした。
関連論文リスト
- Masked Contrastive Graph Representation Learning for Age Estimation [44.96502862249276]
本稿では,画像冗長性情報を扱う上で,グラフ表現学習の特性を利用する。
年齢推定のためのMasked Contrastive Graph Representation Learning (MCGRL)法を提案する。
実世界の顔画像データセットに対する実験結果から,提案手法が他の最先端の年齢推定手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-16T15:53:21Z) - Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文 参考訳(メタデータ) (2022-06-21T09:30:26Z) - In-N-Out Generative Learning for Dense Unsupervised Video Segmentation [89.21483504654282]
本稿では,ラベルなしビデオから視覚的対応を学習する,教師なしビデオオブジェクト(VOS)タスクに焦点を当てる。
In-aNd-Out(INO)生成学習を純粋に生成的観点から提案する。
我々のINOは、最先端の手法をかなりのマージンで上回っている。
論文 参考訳(メタデータ) (2022-03-29T07:56:21Z) - Auto-Transfer: Learning to Route Transferrable Representations [77.30427535329571]
本稿では,適切なターゲット表現にソース表現をルートする方法を自動学習する,新しい対向型マルチアームバンディット手法を提案する。
最先端の知識伝達手法と比較すると,5%以上の精度向上が期待できる。
論文 参考訳(メタデータ) (2022-02-02T13:09:27Z) - Superpixel-based Domain-Knowledge Infusion in Computer Vision [0.7349727826230862]
スーパーピクセルは画像中の高次の知覚的ピクセル群であり、しばしば生のピクセルよりもはるかに多くの情報を運ぶ。
画像の異なるスーパーピクセル間の関係に固有の関係構造が存在する。
この関係情報は、猫画像中の2つの目を表すスーパーピクセル間の関係など、画像に関するある種のドメイン情報を伝達することができる。
論文 参考訳(メタデータ) (2021-05-20T01:25:42Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z) - Superpixel Image Classification with Graph Attention Networks [4.714325419968082]
本稿では,グラフニューラルネットワーク(GNN)モデルを用いた画像分類手法を提案する。
入力画像を領域隣接グラフ (RAG) に変換する。
グラフ畳み込みと自己アテンション機構を組み合わせたグラフアテンションネットワーク(GAT)は、他のGNNモデルより優れていることを実験的に示唆している。
論文 参考訳(メタデータ) (2020-02-13T14:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。