論文の概要: Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization
- arxiv url: http://arxiv.org/abs/2205.07839v1
- Date: Mon, 16 May 2022 17:47:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 13:56:38.605163
- Title: Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization
- Title(参考訳): Deep Spectral Methods: Unsupervised Semantic Segmentation and Localization のための驚くほど強力なベースライン
- Authors: Luke Melas-Kyriazi and Christian Rupprecht and Iro Laina and Andrea
Vedaldi
- Abstract要約: 画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
- 参考スコア(独自算出の注目度): 98.46318529630109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised localization and segmentation are long-standing computer vision
challenges that involve decomposing an image into semantically-meaningful
segments without any labeled data. These tasks are particularly interesting in
an unsupervised setting due to the difficulty and cost of obtaining dense image
annotations, but existing unsupervised approaches struggle with complex scenes
containing multiple objects. Differently from existing methods, which are
purely based on deep learning, we take inspiration from traditional spectral
segmentation methods by reframing image decomposition as a graph partitioning
problem. Specifically, we examine the eigenvectors of the Laplacian of a
feature affinity matrix from self-supervised networks. We find that these
eigenvectors already decompose an image into meaningful segments, and can be
readily used to localize objects in a scene. Furthermore, by clustering the
features associated with these segments across a dataset, we can obtain
well-delineated, nameable regions, i.e. semantic segmentations. Experiments on
complex datasets (Pascal VOC, MS-COCO) demonstrate that our simple spectral
method outperforms the state-of-the-art in unsupervised localization and
segmentation by a significant margin. Furthermore, our method can be readily
used for a variety of complex image editing tasks, such as background removal
and compositing.
- Abstract(参考訳): 教師なしのローカライゼーションとセグメンテーションは、ラベル付きデータなしでイメージを意味的に意味のあるセグメントに分解する、長年にわたるコンピュータビジョンの課題である。
これらのタスクは、高密度な画像アノテーションを得ることの困難さとコストのため、教師なしの環境で特に興味深いが、既存の教師なしのアプローチは、複数のオブジェクトを含む複雑なシーンで苦労している。
深層学習に基づく既存の手法とは違って,画像分解をグラフ分割問題として考えることで,従来のスペクトル分割法から着想を得た。
具体的には,自己教師付きネットワークによる特徴親和行列のラプラシアンの固有ベクトルについて検討する。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
さらに、データセットにまたがってこれらのセグメントに関連する特徴をクラスタリングすることにより、よく定義された名前付き領域、すなわち意味セグメンテーションを得ることができる。
複雑なデータセット (pascal voc, ms-coco) の実験により、我々の単純なスペクトル法は教師なしの局所化とセグメンテーションにおいて有意なマージンで最先端を上回っていることが示されている。
さらに,背景の除去や合成など,複雑な画像編集作業にも容易に利用することができる。
関連論文リスト
- Deep Spectral Methods for Unsupervised Ultrasound Image Interpretation [53.37499744840018]
本稿では, 超音波を応用した非教師型深層学習手法を提案する。
我々は、スペクトルグラフ理論と深層学習法を組み合わせた教師なしディープスペクトル法から重要な概念を統合する。
スペクトルクラスタリングの自己教師型トランスフォーマー機能を利用して、超音波特有のメトリクスと形状と位置の先行値に基づいて意味のあるセグメントを生成し、データセット間のセマンティック一貫性を確保する。
論文 参考訳(メタデータ) (2024-08-04T14:30:14Z) - EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.476136494434766]
意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。
オブジェクトレベルの表現を画像内および画像間の整合性で学習する。
COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文 参考訳(メタデータ) (2024-03-03T11:24:16Z) - Fully and Weakly Supervised Referring Expression Segmentation with
End-to-End Learning [50.40482222266927]
Referring Expression(RES)は、与えられた言語表現に従ってターゲットをローカライズし、セグメンテーションすることを目的としている。
そこで我々は,カーネル分割パイプラインを並列に構築し,より分離し,局所化とセグメント化のステップと相互作用する。
我々の手法は単純だが驚くほど効果的であり、完全に教師された設定と弱い設定において、従来の最先端のRES手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-17T08:29:33Z) - Unsupervised Image Segmentation by Mutual Information Maximization and
Adversarial Regularization [7.165364364478119]
InMARS(Information Maximization and Adrial Regularization)と呼ばれる新しい教師なしセマンティックセマンティックセマンティクス手法を提案する。
シーンを知覚群に解析する人間の知覚に触発され、提案手法はまず、入力画像を意味のある領域(スーパーピクセルとも呼ばれる)に分割する。
次に、相互情報最大化(Multual-Information-Maximization)と、それらの領域を意味論的に意味のあるクラスにクラスタ化するための敵対的トレーニング戦略を利用する。
提案手法は2つの非教師付きセマンティックセグメンテーションデータセット上での最先端性能を実現することを実証した。
論文 参考訳(メタデータ) (2021-07-01T18:36:27Z) - Sparse Object-level Supervision for Instance Segmentation with Pixel
Embeddings [4.038011160363972]
ほとんどの最先端のインスタンスセグメンテーションメソッドは、密接な注釈付き画像でトレーニングする必要があります。
非空間埋め込みに基づく提案フリーセグメンテーション手法を提案する。
本研究では, 異なる顕微鏡モードにおける2次元および3次元分割問題の解法について検討した。
論文 参考訳(メタデータ) (2021-03-26T16:36:56Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - CellSegmenter: unsupervised representation learning and instance
segmentation of modular images [0.0]
本稿では,教師なし表現学習とインスタンスセグメンテーションタスクのための構造化された深層生成モデルとアモータイズ推論フレームワークを提案する。
提案した推論アルゴリズムは、再帰的なメカニズムなしで畳み込み並列化されている。
細胞核イメージングデータセットで得られたセグメンテーション結果を示し,高品質なセグメンテーションを実現するための手法の有効性を示した。
論文 参考訳(メタデータ) (2020-11-25T02:10:58Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。