論文の概要: Rethinking Unsupervised Neural Superpixel Segmentation
- arxiv url: http://arxiv.org/abs/2206.10213v1
- Date: Tue, 21 Jun 2022 09:30:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 16:52:12.332523
- Title: Rethinking Unsupervised Neural Superpixel Segmentation
- Title(参考訳): 教師なしスーパーピクセルセグメンテーションの再考
- Authors: Moshe Eliasof, Nir Ben Zikri, Eran Treister
- Abstract要約: CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
- 参考スコア(独自算出の注目度): 6.123324869194195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the concept of unsupervised learning for superpixel segmentation
via CNNs has been studied. Essentially, such methods generate superpixels by
convolutional neural network (CNN) employed on a single image, and such CNNs
are trained without any labels or further information. Thus, such approach
relies on the incorporation of priors, typically by designing an objective
function that guides the solution towards a meaningful superpixel segmentation.
In this paper we propose three key elements to improve the efficacy of such
networks: (i) the similarity of the \emph{soft} superpixelated image compared
to the input image, (ii) the enhancement and consideration of object edges and
boundaries and (iii) a modified architecture based on atrous convolution, which
allow for a wider field of view, functioning as a multi-scale component in our
network. By experimenting with the BSDS500 dataset, we find evidence to the
significance of our proposal, both qualitatively and quantitatively.
- Abstract(参考訳): 近年,CNNによる超画素分割のための教師なし学習の概念が研究されている。
基本的に、このような方法は畳み込みニューラルネットワーク(cnn)によってスーパーピクセルを生成し、そのようなcnnはラベルやそれ以上の情報なしでトレーニングされる。
したがって、このようなアプローチは、通常、ソリューションを有意義なスーパーピクセルセグメンテーションへと導く目的関数を設計することによって、事前の編入に依存する。
本稿では,そのようなネットワークの有効性を改善するための3つの重要な要素を提案する。
(i)入力画像と比較して、 \emph{soft} 上画素画像の類似性。
(ii)オブジェクトエッジとバウンダリの強化と考察
(iii)ネットワークのマルチスケールコンポーネントとして機能する、より広い視野の視野を可能にするatrous畳み込みに基づく修正されたアーキテクチャ。
bsds500データセットを実験することで,提案の質的および定量的な意義を示す証拠が得られた。
関連論文リスト
- Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Single-Image Super-Resolution Reconstruction based on the Differences of
Neighboring Pixels [3.257500143434429]
深層学習技術は、単一画像超解像(SISR)の性能向上に用いられた。
本稿では,推定画像と接地構造画像からグラフを構築することにより,CNNを正規化するための隣接画素の違いを提案する。
提案手法は, ベンチマークデータセットの定量的, 質的評価の観点から, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-28T07:30:07Z) - Unsupervised Image Semantic Segmentation through Superpixels and Graph
Neural Networks [6.123324869194195]
ラベル付きデータが不足している多くの実世界のシナリオでは、教師なしのイメージセグメンテーションが重要なタスクである。
本稿では,相互情報最大化(MIM),ニューラルスーパーピクセル,グラフニューラルネットワーク(GNN)をエンドツーエンドに組み合わせて,教師なし学習の最近の進歩を活用する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-10-21T08:35:18Z) - Multiscale Convolutional Transformer with Center Mask Pretraining for
Hyperspectral Image Classificationtion [14.33259265286265]
本稿では,空間スペクトル情報の効率的な抽出を実現するために,高スペクトル画像(HSI)のための高速多スケール畳み込みモジュールを提案する。
マスクオートエンコーダと同様に、我々の事前学習法は、エンコーダ内の中央画素の対応するトークンのみをマスクし、残りのトークンをデコーダに入力し、中央画素のスペクトル情報を再構成する。
論文 参考訳(メタデータ) (2022-03-09T14:42:26Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Superpixel-based Domain-Knowledge Infusion in Computer Vision [0.7349727826230862]
スーパーピクセルは画像中の高次の知覚的ピクセル群であり、しばしば生のピクセルよりもはるかに多くの情報を運ぶ。
画像の異なるスーパーピクセル間の関係に固有の関係構造が存在する。
この関係情報は、猫画像中の2つの目を表すスーパーピクセル間の関係など、画像に関するある種のドメイン情報を伝達することができる。
論文 参考訳(メタデータ) (2021-05-20T01:25:42Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z) - Superpixel Segmentation via Convolutional Neural Networks with
Regularized Information Maximization [11.696069523681178]
ランダムd畳み込みニューラルネットワーク(CNN)を推論時間で最適化し,教師なしのスーパーピクセルセグメンテーション手法を提案する。
提案手法は,スーパーピクセルセグメンテーションの目的関数を最小化することにより,ラベルのない単一画像からCNNを介してスーパーピクセルを生成する。
論文 参考訳(メタデータ) (2020-02-17T04:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。