論文の概要: Exploring Generative Adversarial Networks for Text-to-Image Generation
with Evolution Strategies
- arxiv url: http://arxiv.org/abs/2207.02907v1
- Date: Wed, 6 Jul 2022 18:28:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-08 13:34:28.036542
- Title: Exploring Generative Adversarial Networks for Text-to-Image Generation
with Evolution Strategies
- Title(参考訳): 進化戦略を用いたテキスト・画像生成のための生成逆ネットワークの探索
- Authors: Victor Costa, Nuno Louren\c{c}o, Jo\~ao Correia, Penousal Machado
- Abstract要約: いくつかの方法は、ジェネレーティブ・アドバイサル・ネットワークのような事前訓練されたモデルに依存し、生成モデルの潜在空間を探索する。
本稿では,共分散行列適応進化戦略を用いて生成逆数ネットワークの潜伏空間を探索する。
本手法は, 勾配に基づく手法と進化的手法を組み合わせ, 結果の質を生かした手法であることを示す。
- 参考スコア(独自算出の注目度): 0.4588028371034407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of generative models, text-to-image generation achieved
impressive results in recent years. Models using different approaches were
proposed and trained in huge datasets of pairs of texts and images. However,
some methods rely on pre-trained models such as Generative Adversarial
Networks, searching through the latent space of the generative model by using a
gradient-based approach to update the latent vector, relying on loss functions
such as the cosine similarity. In this work, we follow a different direction by
proposing the use of Covariance Matrix Adaptation Evolution Strategy to explore
the latent space of Generative Adversarial Networks. We compare this approach
to the one using Adam and a hybrid strategy. We design an experimental study to
compare the three approaches using different text inputs for image generation
by adapting an evaluation method based on the projection of the resulting
samples into a two-dimensional grid to inspect the diversity of the
distributions. The results evidence that the evolutionary method achieves more
diversity in the generation of samples, exploring different regions of the
resulting grids. Besides, we show that the hybrid method combines the explored
areas of the gradient-based and evolutionary approaches, leveraging the quality
of the results.
- Abstract(参考訳): 生成モデルでは, 近年, テキスト・画像生成が顕著な成果を上げている。
異なるアプローチを用いたモデルが提案され、テキストと画像のペアの巨大なデータセットでトレーニングされた。
しかし、いくつかの方法は、生成逆ネットワークのような事前学習されたモデルに依存し、コサイン類似性のような損失関数に依存する潜在ベクトルを更新するために勾配に基づくアプローチを用いて生成モデルの潜在空間を探索する。
本研究では,共分散行列適応進化戦略(covariance matrix adaptation evolution strategy)を用いて,生成型逆ネットワークの潜在空間を探索する手法を提案する。
我々はこのアプローチをAdamとハイブリッド戦略を使ったアプローチと比較する。
本研究では,画像生成のための異なるテキスト入力を用いた3つの手法を比較し,得られたサンプルの投影に基づく評価手法を2次元グリッドに適応させ,分布の多様性を検証した。
結果は、進化的手法がサンプルの生成においてより多様性を達成し、結果として得られる格子の異なる領域を探索することを示す。
さらに, このハイブリッド手法は, グラデーションベースと進化的アプローチの探索領域を組み合わせることで, 結果の質を活用できることを示した。
関連論文リスト
- Varying Manifolds in Diffusion: From Time-varying Geometries to Visual Saliency [25.632973225129728]
前方拡散過程と逆生成過程が多様体上の一連の分布を構成する拡散モデルの幾何学的性質について検討する。
生成速度は画像成分の視覚的明瞭度などの直感的な視覚特性と高い相関性を示す。
本稿では,画像成分の生成速度を時間とともに推定し,生成曲線を導出する効率的かつ微分可能な手法を提案する。
論文 参考訳(メタデータ) (2024-06-07T07:32:41Z) - GE-AdvGAN: Improving the transferability of adversarial samples by
gradient editing-based adversarial generative model [69.71629949747884]
GAN(Generative Adversarial Networks)のような逆生成モデルは、様々な種類のデータを生成するために広く応用されている。
本研究では, GE-AdvGAN という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-11T16:43:16Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - Investigating GANsformer: A Replication Study of a State-of-the-Art
Image Generation Model [0.0]
我々は、オリジナルのGANネットワークであるGANformerの新たなバリエーションを再現し、評価する。
リソースと時間制限のため、ネットワークのトレーニング時間、データセットタイプ、サイズを制限しなければなりませんでした。
論文 参考訳(メタデータ) (2023-03-15T12:51:16Z) - Analogous to Evolutionary Algorithm: Designing a Unified Sequence Model [58.17021225930069]
実演的進化アルゴリズム(EA)と類似した視覚変換器の合理性について説明する。
我々は、より効率的なEATモデルを提案し、様々なタスクに柔軟に対処するタスク関連ヘッドを設計する。
近年のビジョントランスに比べて,イメージネット分類作業における最先端の成果が得られている。
論文 参考訳(メタデータ) (2021-05-31T16:20:03Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z) - Demonstrating the Evolution of GANs through t-SNE [0.4588028371034407]
COEGANのような進化的アルゴリズムは、最近、GANトレーニングを改善するソリューションとして提案されている。
本研究では, t-distributed Neighbour Embedding (t-SNE) を用いたGANの進展評価手法を提案する。
結果の t-SNE マップと Jaccard インデックスに基づく計量をモデル品質を表すために提案する。
論文 参考訳(メタデータ) (2021-01-31T20:07:08Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - Network Bending: Expressive Manipulation of Deep Generative Models [0.2062593640149624]
ネットワーク曲げと呼ばれる深層生成モデルを操作するための新しいフレームワークを提案する。
生成過程において意味論的に意味のある側面を直接操作できるだけでなく、幅広い表現的な結果を得ることができるかを示す。
論文 参考訳(メタデータ) (2020-05-25T21:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。