論文の概要: StyleGAN of All Trades: Image Manipulation with Only Pretrained StyleGAN
- arxiv url: http://arxiv.org/abs/2111.01619v1
- Date: Tue, 2 Nov 2021 14:31:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 14:20:05.024863
- Title: StyleGAN of All Trades: Image Manipulation with Only Pretrained StyleGAN
- Title(参考訳): すべての取引のスタイルガン:プリトレーニングされたスタイルガンのみによる画像操作
- Authors: Min Jin Chong, Hsin-Ying Lee, David Forsyth
- Abstract要約: 事前訓練されたStyleGANといくつかの操作で、様々なタスクで最先端のメソッドと互換性があることを示す。
提案手法は単純で効率的であり,既存のStyleGANモデルにも適用可能である。
- 参考スコア(独自算出の注目度): 17.93566359555703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, StyleGAN has enabled various image manipulation and editing tasks
thanks to the high-quality generation and the disentangled latent space.
However, additional architectures or task-specific training paradigms are
usually required for different tasks. In this work, we take a deeper look at
the spatial properties of StyleGAN. We show that with a pretrained StyleGAN
along with some operations, without any additional architecture, we can perform
comparably to the state-of-the-art methods on various tasks, including image
blending, panorama generation, generation from a single image, controllable and
local multimodal image to image translation, and attributes transfer. The
proposed method is simple, effective, efficient, and applicable to any existing
pretrained StyleGAN model.
- Abstract(参考訳): 近年、styleganは高品質な生成と不連続な潜在空間のおかげで、様々な画像操作や編集タスクを可能にしている。
しかし、追加のアーキテクチャやタスク固有のトレーニングパラダイムは、通常、異なるタスクのために必要です。
本研究では,StyleGANの空間特性についてより深く考察する。
事前訓練されたStyleGANといくつかの操作を併用することで,画像ブレンディング,パノラマ生成,単一画像からの生成,制御可能で局所的なマルチモーダル画像から画像翻訳,属性転送など,さまざまなタスクにおける最先端の手法と互換性を持たせることができることを示す。
提案手法は単純で効率的であり,既存のStyleGANモデルにも適用可能である。
関連論文リスト
- GIST: Towards Photorealistic Style Transfer via Multiscale Geometric Representations [9.514509577589449]
GISTは、標準的なNeural Style Transfer自動エンコーディングフレームワークをマルチスケール画像拡張に置き換えている。
本手法は,ウェーブレットやコンチューレットなどの多方向および多方向の表現を最適輸送問題の解法によりマッチングする。
論文 参考訳(メタデータ) (2024-12-03T07:05:39Z) - Ada-adapter:Fast Few-shot Style Personlization of Diffusion Model with Pre-trained Image Encoder [57.574544285878794]
Ada-Adapterは拡散モデルの少数ショットスタイルのパーソナライズのための新しいフレームワークである。
提案手法は,単一の参照画像を用いたゼロショット方式の効率的な転送を可能にする。
フラットアートや3Dレンダリング,ロゴデザインなど,さまざまな芸術的スタイルに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-07-08T02:00:17Z) - Multimodality-guided Image Style Transfer using Cross-modal GAN
Inversion [42.345533741985626]
そこで本研究では,テキストガイダンスに基づいて,より優れたスタイル転送を実現する新しい手法を提案する。
提案手法は複数のソースやモダリティからのスタイル入力を可能にし,マルチモーダル誘導画像スタイル転送(MMIST)を実現する。
具体的には,特定のスタイルに整合したスタイル表現を生成する,新しいクロスモーダルなGANインバージョン手法によりMMISTを実現する。
論文 参考訳(メタデータ) (2023-12-04T06:38:23Z) - Customize StyleGAN with One Hand Sketch [0.0]
本稿では,単一のユーザスケッチでスタイルGAN画像を制御するフレームワークを提案する。
我々は、エネルギーベース学習により、事前学習したStyleGANモデルの潜在空間における条件分布を学習する。
我々のモデルは、入力スケッチにセマンティックに整合したマルチモーダル画像を生成することができる。
論文 参考訳(メタデータ) (2023-10-29T09:32:33Z) - Federated Domain Generalization for Image Recognition via Cross-Client
Style Transfer [60.70102634957392]
ドメイン一般化(Domain Generalization, DG)は、画像認識においてホットなトピックであり、目に見えないドメインでうまく機能する一般的なモデルを訓練することを目的としている。
本稿では,データサンプルを交換することなく,クロスクライアント型転送(CCST)による画像認識のための新しい領域一般化手法を提案する。
本手法は2つのDGベンチマーク(PACS, OfficeHome)とFL設定における大規模医用画像データセット(Camelyon17)において,最近のSOTA DG法より優れている。
論文 参考訳(メタデータ) (2022-10-03T13:15:55Z) - Domain Enhanced Arbitrary Image Style Transfer via Contrastive Learning [84.8813842101747]
Contrastive Arbitrary Style Transfer (CAST) は、新しいスタイル表現学習法である。
本フレームワークは,スタイルコード符号化のための多層スタイルプロジェクタ,スタイル分布を効果的に学習するためのドメイン拡張モジュール,画像スタイル転送のための生成ネットワークという,3つのキーコンポーネントから構成される。
論文 参考訳(メタデータ) (2022-05-19T13:11:24Z) - StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators [63.85888518950824]
生成モデルを新しいドメインに移行できるテキスト駆動方式を提案する。
自然言語のプロンプトと数分の訓練によって、我々の手法は複数のドメインにまたがってジェネレータを適応させることができることを示す。
論文 参考訳(メタデータ) (2021-08-02T14:46:46Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - TSIT: A Simple and Versatile Framework for Image-to-Image Translation [103.92203013154403]
画像間翻訳のためのシンプルで多用途なフレームワークを提案する。
新たに提案した特徴変換を用いた2ストリーム生成モデルを提案する。
これにより、マルチスケールのセマンティック構造情報とスタイル表現を効果的に捕捉し、ネットワークに融合させることができる。
体系的な研究は、提案手法をいくつかの最先端タスク固有のベースラインと比較し、知覚的品質と定量的評価の両面での有効性を検証する。
論文 参考訳(メタデータ) (2020-07-23T15:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。