論文の概要: LARGE: Latent-Based Regression through GAN Semantics
- arxiv url: http://arxiv.org/abs/2107.11186v1
- Date: Thu, 22 Jul 2021 17:55:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-26 13:58:53.718894
- Title: LARGE: Latent-Based Regression through GAN Semantics
- Title(参考訳): LARGE: GANセマンティックスによる潜伏型回帰
- Authors: Yotam Nitzan, Rinon Gal, Ofir Brenner, Daniel Cohen-Or
- Abstract要約: 本稿では,少数ショットや弱ビジョンを用いた回帰課題の解法を提案する。
提案手法は,幅広い領域にまたがって適用可能であること,複数の遅延方向探索フレームワークを活用すること,そして最先端の結果が得られることを示す。
- 参考スコア(独自算出の注目度): 42.50535188836529
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel method for solving regression tasks using few-shot or weak
supervision. At the core of our method is the fundamental observation that GANs
are incredibly successful at encoding semantic information within their latent
space, even in a completely unsupervised setting. For modern generative
frameworks, this semantic encoding manifests as smooth, linear directions which
affect image attributes in a disentangled manner. These directions have been
widely used in GAN-based image editing. We show that such directions are not
only linear, but that the magnitude of change induced on the respective
attribute is approximately linear with respect to the distance traveled along
them. By leveraging this observation, our method turns a pre-trained GAN into a
regression model, using as few as two labeled samples. This enables solving
regression tasks on datasets and attributes which are difficult to produce
quality supervision for. Additionally, we show that the same latent-distances
can be used to sort collections of images by the strength of given attributes,
even in the absence of explicit supervision. Extensive experimental evaluations
demonstrate that our method can be applied across a wide range of domains,
leverage multiple latent direction discovery frameworks, and achieve
state-of-the-art results in few-shot and low-supervision settings, even when
compared to methods designed to tackle a single task.
- Abstract(参考訳): 本稿では,少数ショットや弱ビジョンを用いた回帰課題の解法を提案する。
提案手法の核心は,ganが潜在空間内において,完全に教師なしの設定であっても,意味情報のエンコーディングに驚くほど成功しているという基本的な観察である。
現代の生成フレームワークでは、このセマンティックエンコーディングは、画像属性に不連続な方法で影響を及ぼす滑らかで直線的な方向として現れます。
これらの方向は、GANベースの画像編集に広く用いられている。
これらの方向が線形であるだけでなく,各属性によって引き起こされる変化の大きさが,沿線を走行する距離に対してほぼ線形であることを示す。
本手法は, 事前学習したGANを2つのラベル付きサンプルを用いて回帰モデルに変換する。
これにより、品質管理が難しいデータセットや属性での回帰タスクの解決が可能になる。
また,同じ潜在距離を,明示的な監督がなくても,与えられた属性の強さによって画像のソートに使用できることを示す。
大規模実験により,本手法は多分野にまたがって適用可能であり,複数の遅延方向探索フレームワークを活用でき,また,単一タスクに対処する手法と比較しても,数ショット・低ビジョン設定における最新結果が得られることが示された。
関連論文リスト
- SC2GAN: Rethinking Entanglement by Self-correcting Correlated GAN Space [16.040942072859075]
ある属性の編集方向に従う遺伝子ネットワークは、他の属性と絡み合った変更をもたらす可能性がある。
本稿では,低密度の潜伏コードサンプルを元の潜伏空間に再プロジェクションすることで,SC$2$GANのアンタングル化を実現する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-10T14:42:32Z) - Evaluating the Label Efficiency of Contrastive Self-Supervised Learning
for Multi-Resolution Satellite Imagery [0.0]
遠隔センシング領域における自己教師付き学習は、容易に利用可能なラベル付きデータを活用するために応用されている。
本稿では,ラベル効率のレンズを用いた自己教師型視覚表現学習について検討する。
論文 参考訳(メタデータ) (2022-10-13T06:54:13Z) - Exploring Gradient-based Multi-directional Controls in GANs [19.950198707910587]
本稿では, 非線形制御の発見手法を提案する。
提案手法は,多方向・多方向特性の多種多様な属性に対してきめ細かな制御が可能であり,現状の手法よりもはるかに優れた非絡み合いを実現する能力を示す。
論文 参考訳(メタデータ) (2022-09-01T19:10:26Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Latent Transformations via NeuralODEs for GAN-based Image Editing [25.272389610447856]
トレーニング可能なNeural ODEのフローとして実現された非線形潜時符号操作は、多くの実用的な非顔画像領域にとって有益であることを示す。
特に、既知の属性を持つ多数のデータセットを調査し、ある属性操作が線形シフトのみで取得することが困難であることを実証する。
論文 参考訳(メタデータ) (2021-11-29T18:59:54Z) - Orthogonal Jacobian Regularization for Unsupervised Disentanglement in
Image Generation [64.92152574895111]
直交ジャコビアン正規化法(OroJaR)を提案する。
提案手法は, 絡み合った, 制御可能な画像生成に有効であり, 最先端の手法に対して好適に機能する。
論文 参考訳(メタデータ) (2021-08-17T15:01:46Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。