論文の概要: Network Bending: Expressive Manipulation of Deep Generative Models
- arxiv url: http://arxiv.org/abs/2005.12420v2
- Date: Fri, 12 Mar 2021 15:06:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 05:28:28.372227
- Title: Network Bending: Expressive Manipulation of Deep Generative Models
- Title(参考訳): ネットワーク曲げ:深い生成モデルの表現的操作
- Authors: Terence Broad, Frederic Fol Leymarie, Mick Grierson
- Abstract要約: ネットワーク曲げと呼ばれる深層生成モデルを操作するための新しいフレームワークを提案する。
生成過程において意味論的に意味のある側面を直接操作できるだけでなく、幅広い表現的な結果を得ることができるかを示す。
- 参考スコア(独自算出の注目度): 0.2062593640149624
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce a new framework for manipulating and interacting with deep
generative models that we call network bending. We present a comprehensive set
of deterministic transformations that can be inserted as distinct layers into
the computational graph of a trained generative neural network and applied
during inference. In addition, we present a novel algorithm for analysing the
deep generative model and clustering features based on their spatial activation
maps. This allows features to be grouped together based on spatial similarity
in an unsupervised fashion. This results in the meaningful manipulation of sets
of features that correspond to the generation of a broad array of semantically
significant features of the generated images. We outline this framework,
demonstrating our results on state-of-the-art deep generative models trained on
several image datasets. We show how it allows for the direct manipulation of
semantically meaningful aspects of the generative process as well as allowing
for a broad range of expressive outcomes.
- Abstract(参考訳): 本稿では,ネットワーク曲げと呼ばれる深層生成モデルを操作するための新しいフレームワークを提案する。
本稿では,訓練された生成ニューラルネットワークの計算グラフに異なる層として挿入し,推論中に適用できる決定論的変換の包括的集合を提案する。
さらに,その空間活性化マップに基づいて,深層生成モデルとクラスタリング特徴を解析するための新しいアルゴリズムを提案する。
これにより、教師なしの方法で空間的類似性に基づいて特徴をまとめることができる。
これにより、生成された画像の意味的に重要な特徴の幅広い配列の生成に対応する特徴の集合を有意義に操作できる。
我々はこのフレームワークを概説し、いくつかの画像データセットでトレーニングされた最先端の深層生成モデルについて結果を示す。
生成過程において意味論的に意味のある側面を直接操作できるだけでなく、幅広い表現的な結果を得ることができるかを示す。
関連論文リスト
- SpaceMesh: A Continuous Representation for Learning Manifold Surface Meshes [61.110517195874074]
本稿では,ニューラルネットワークの出力として,複雑な接続性を持つ多様体多角形メッシュを直接生成する手法を提案する。
私たちの重要なイノベーションは、各メッシュで連続的な遅延接続空間を定義することです。
アプリケーションでは、このアプローチは生成モデルから高品質な出力を得るだけでなく、メッシュ修復のような挑戦的な幾何処理タスクを直接学習することを可能にする。
論文 参考訳(メタデータ) (2024-09-30T17:59:03Z) - Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。
ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文 参考訳(メタデータ) (2024-06-14T13:12:07Z) - Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Learning Structured Output Representations from Attributes using Deep
Conditional Generative Models [0.0]
本稿では,条件付き変分オートエンコーダアーキテクチャを再現し,属性を条件付き画像でトレーニングする。
毛髪の色や眼鏡などの特徴の異なる新しい顔と、異なる鳥類種のサンプルを創り出そうとする。
論文 参考訳(メタデータ) (2023-04-30T17:25:31Z) - Image Synthesis via Semantic Composition [74.68191130898805]
本稿では,その意味的レイアウトに基づいて現実的なイメージを合成する新しい手法を提案する。
類似した外観を持つ物体に対して、類似した表現を共有するという仮説が立てられている。
本手法は, 空間的変化と関連表現の両方を生じる, 外観相関による領域間の依存関係を確立する。
論文 参考訳(メタデータ) (2021-09-15T02:26:07Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z) - Interpreting Spatially Infinite Generative Models [40.453301580034804]
近年の研究では、空間ノイズベクトルを完全な畳み込みニューラルネットワークに入力することで、任意の解像度出力画像の生成と任意の解像度トレーニング画像のトレーニングが可能であることが示されている。
空間過程への接続を描画することで、無限空間生成のしっかりとした理論的解釈を提供する。
世界地図生成、パノラマ画像、テクスチャ合成の実験は、任意の大きさの画像を効率的に生成する$infty$-GANの能力を検証する。
論文 参考訳(メタデータ) (2020-07-24T09:00:41Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z) - Generating Annotated High-Fidelity Images Containing Multiple Coherent
Objects [10.783993190686132]
コンテキスト情報を明示的に必要とせずに、複数のオブジェクトで画像を合成できるマルチオブジェクト生成フレームワークを提案する。
我々は,Multi-MNISTおよびCLEVRデータセットを用いた実験により,コヒーレンシーと忠実さの保存方法を示す。
論文 参考訳(メタデータ) (2020-06-22T11:33:55Z) - Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。
得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。
最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文 参考訳(メタデータ) (2019-02-18T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。