論文の概要: Finding an Unsupervised Image Segmenter in Each of Your Deep Generative
Models
- arxiv url: http://arxiv.org/abs/2105.08127v1
- Date: Mon, 17 May 2021 19:34:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-19 14:16:16.371358
- Title: Finding an Unsupervised Image Segmenter in Each of Your Deep Generative
Models
- Title(参考訳): 深層生成モデルにおける教師なし画像セグメンタの探索
- Authors: Luke Melas-Kyriazi and Christian Rupprecht and Iro Laina and Andrea
Vedaldi
- Abstract要約: 我々は,前景・後景画像分離に繋がる方向を求める自動手順を開発した。
これらの方向を用いて、人間の監督なしに画像分割モデルを訓練する。
- 参考スコア(独自算出の注目度): 92.92095626286223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research has shown that numerous human-interpretable directions exist
in the latent space of GANs. In this paper, we develop an automatic procedure
for finding directions that lead to foreground-background image separation, and
we use these directions to train an image segmentation model without human
supervision. Our method is generator-agnostic, producing strong segmentation
results with a wide range of different GAN architectures. Furthermore, by
leveraging GANs pretrained on large datasets such as ImageNet, we are able to
segment images from a range of domains without further training or finetuning.
Evaluating our method on image segmentation benchmarks, we compare favorably to
prior work while using neither human supervision nor access to the training
data. Broadly, our results demonstrate that automatically extracting
foreground-background structure from pretrained deep generative models can
serve as a remarkably effective substitute for human supervision.
- Abstract(参考訳): 近年の研究では、GANの潜在空間に多くの人間解釈可能な方向が存在することが示されている。
本稿では,前景画像の分離につながる方向を自動で検出する手法を開発し,これらの方向を用いて人間の監督なしに画像分割モデルを訓練する。
本手法はジェネレータ非依存であり,幅広いganアーキテクチャを用いて強いセグメンテーション結果を生成する。
さらに、imagenetなどの大規模データセットで事前トレーニングされたganを利用することで、さらなるトレーニングや微調整をすることなく、さまざまなドメインからイメージをセグメント化することができる。
本手法を画像分割ベンチマークで評価し,人間の監督やトレーニングデータへのアクセスを使わずに,事前作業に好適な比較を行った。
以上の結果から,事前訓練した深部生成モデルから地下構造を自動的に抽出することが,人的監督の代用として極めて有効であることが示唆された。
関連論文リスト
- Self-guided Few-shot Semantic Segmentation for Remote Sensing Imagery
Based on Large Vision Models [14.292149307183967]
本研究は,少数ショットセマンティックセグメンテーションの自動化を目的とした構造化フレームワークを提案する。
SAMモデルを利用して、意味的に識別可能なセグメンテーションの結果をより効率的に生成する。
提案手法の中心は,従来のガイドマスクを利用してSAMの粗い画素単位のプロンプトを生成する,新しい自動プロンプト学習手法である。
論文 参考訳(メタデータ) (2023-11-22T07:07:55Z) - Domain Adaptive and Generalizable Network Architectures and Training
Strategies for Semantic Image Segmentation [108.33885637197614]
教師なしドメイン適応(UDA)とドメイン一般化(DG)により、ソースドメインでトレーニングされた機械学習モデルは、ラベルなしまたは目に見えないターゲットドメインでうまく機能する。
UDA&DGのマルチレゾリューション・フレームワークであるHRDAを提案する。このフレームワークは、細かなセグメンテーションの詳細を保存するための小さな高分解能作物の強度と、学習されたスケールの注意を伴って長距離のコンテキスト依存を捕捉する大規模な低分解能作物の強度を組み合わせたものである。
論文 参考訳(メタデータ) (2023-04-26T15:18:45Z) - Denoising Diffusion Probabilistic Models for Generation of Realistic
Fully-Annotated Microscopy Image Data Sets [1.07539359851877]
本研究では,拡散モデルにより,フルアノテートされた顕微鏡画像データセットを効果的に生成できることを実証する。
提案されたパイプラインは、ディープラーニングベースのセグメンテーションアプローチのトレーニングにおいて、手動アノテーションへの依存を減らすのに役立つ。
論文 参考訳(メタデータ) (2023-01-02T14:17:08Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z) - Learning High-Resolution Domain-Specific Representations with a GAN
Generator [5.8720142291102135]
本稿では,GANジェネレータが学習した表現を,軽量デコーダを用いてセマンティックセグメンテーションマップに簡単に投影できることを示す。
本稿では、教師なしドメイン固有の事前学習に使用できるGANジェネレータの表現を近似するLayerMatch方式を提案する。
また,LayerMatch-pretrained backboneの使用は,ImageNetの標準教師付き事前トレーニングよりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2020-06-18T11:57:18Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。