論文の概要: GAN Inversion for Out-of-Range Images with Geometric Transformations
- arxiv url: http://arxiv.org/abs/2108.08998v1
- Date: Fri, 20 Aug 2021 04:38:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-23 13:29:12.121389
- Title: GAN Inversion for Out-of-Range Images with Geometric Transformations
- Title(参考訳): 幾何学変換を用いた外乱画像のGANインバージョン
- Authors: Kyoungkook Kang, Seongtae Kim, Sunghyun Cho
- Abstract要約: 我々は、アウト・オブ・レンジ画像のセマンティック編集のための新しいGAN変換手法であるBDInvertを提案する。
実験の結果,BDInvertは幾何学的変換によるアウト・オブ・レンジ画像のセマンティックな編集を効果的にサポートすることがわかった。
- 参考スコア(独自算出の注目度): 22.914126221037222
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For successful semantic editing of real images, it is critical for a GAN
inversion method to find an in-domain latent code that aligns with the domain
of a pre-trained GAN model. Unfortunately, such in-domain latent codes can be
found only for in-range images that align with the training images of a GAN
model. In this paper, we propose BDInvert, a novel GAN inversion approach to
semantic editing of out-of-range images that are geometrically unaligned with
the training images of a GAN model. To find a latent code that is semantically
editable, BDInvert inverts an input out-of-range image into an alternative
latent space than the original latent space. We also propose a regularized
inversion method to find a solution that supports semantic editing in the
alternative space. Our experiments show that BDInvert effectively supports
semantic editing of out-of-range images with geometric transformations.
- Abstract(参考訳): 実画像のセマンティック編集を成功させるためには、事前訓練されたGANモデルのドメインと整合するドメイン内潜在コードを見つけるために、GANインバージョン法が重要である。
残念ながら、そのようなドメイン内の潜伏符号は、GANモデルのトレーニング画像と一致する範囲内の画像に対してのみ見つかる。
本稿では,GANモデルのトレーニング画像と幾何学的に一致しない領域外画像のセマンティック編集のための新しいGAN変換手法であるBDInvertを提案する。
意味的に編集可能な潜在コードを見つけるために、bdinvertは入力された範囲外画像を元の潜在コード空間よりも別の潜在コード空間に反転させる。
また,代替空間における意味編集をサポートする解を求めるための正規化逆変換法を提案する。
実験の結果,BDInvertは幾何学的変換による領域外画像のセマンティックな編集を効果的にサポートすることがわかった。
関連論文リスト
- In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - JoIN: Joint GANs Inversion for Intrinsic Image Decomposition [16.02463667910604]
我々は,GAN(Generative Adversarial Networks)のバンクを用いて,不測の逆画像問題を解決することを提案する。
提案手法は,複雑な画像分布をキャプチャするGANの実証的な成功に基づいている。
論文 参考訳(メタデータ) (2023-05-18T22:09:32Z) - Spatial Steerability of GANs via Self-Supervision from Discriminator [123.27117057804732]
本稿では,GANの空間的ステアビリティを向上させるための自己教師型アプローチを提案する。
具体的には、空間帰納バイアスとして生成モデルの中間層に符号化されるランダムなガウス熱マップを設計する。
推論中、ユーザは直感的に空間のヒートマップと対話し、シーンのレイアウトを調整したり、移動したり、オブジェクトを削除したりすることで、出力画像を編集することができる。
論文 参考訳(メタデータ) (2023-01-20T07:36:29Z) - FlexIT: Towards Flexible Semantic Image Translation [59.09398209706869]
我々は,任意の入力画像とユーザが定義したテキストを編集するための新しい方法であるFlexITを提案する。
まず、FlexITは入力画像とテキストをCLIPマルチモーダル埋め込み空間内の単一のターゲットポイントに結合する。
我々は、入力画像を目標点に向けて反復的に変換し、新しい正規化用語で一貫性と品質を確保する。
論文 参考訳(メタデータ) (2022-03-09T13:34:38Z) - Cycle-Consistent Inverse GAN for Text-to-Image Synthesis [101.97397967958722]
本稿では,テキスト・ツー・イメージ・ジェネレーションとテキスト・ガイドによる画像操作を行うために,Cycle-Consistent Inverse GANの統一フレームワークを提案する。
我々は、GANの反転モデルを学び、画像をGANの潜在空間に変換し、各画像の反転潜在符号を得る。
テキスト誘導最適化モジュールでは、反転潜在符号を最適化することにより、所望のセマンティック属性を持つ画像を生成する。
論文 参考訳(メタデータ) (2021-08-03T08:38:16Z) - Force-in-domain GAN inversion [0.0]
画像生成の訓練を受けると、GAN(Generative Adversarial Networks)の潜在領域に様々な意味が現れる。
ドメイン内GANインバージョンアプローチは、最近、潜伏空間内の逆コードを制限するために提案されている。
本稿では,ドメイン内GANに基づくフォースインドメインGANを提案する。
論文 参考訳(メタデータ) (2021-07-13T13:03:53Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。