論文の概要: Exploring the Effectiveness of Mask-Guided Feature Modulation as a
Mechanism for Localized Style Editing of Real Images
- arxiv url: http://arxiv.org/abs/2211.11224v1
- Date: Mon, 21 Nov 2022 07:36:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:50:52.593534
- Title: Exploring the Effectiveness of Mask-Guided Feature Modulation as a
Mechanism for Localized Style Editing of Real Images
- Title(参考訳): 実画像の局所的スタイル編集機構としてのマスクガイド型特徴変調の有効性の検討
- Authors: Snehal Singh Tomar, Maitreya Suin, A.N. Rajagopalan
- Abstract要約: 本稿ではセマンティック・スタイル・オートエンコーダ(SSAE)について述べる。
この作業は,将来の作業のガイドプライマーとして機能する。
- 参考スコア(独自算出の注目度): 33.018300966769516
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The success of Deep Generative Models at high-resolution image generation has
led to their extensive utilization for style editing of real images. Most
existing methods work on the principle of inverting real images onto their
latent space, followed by determining controllable directions. Both inversion
of real images and determination of controllable latent directions are
computationally expensive operations. Moreover, the determination of
controllable latent directions requires additional human supervision. This work
aims to explore the efficacy of mask-guided feature modulation in the latent
space of a Deep Generative Model as a solution to these bottlenecks. To this
end, we present the SemanticStyle Autoencoder (SSAE), a deep Generative
Autoencoder model that leverages semantic mask-guided latent space manipulation
for highly localized photorealistic style editing of real images. We present
qualitative and quantitative results for the same and their analysis. This work
shall serve as a guiding primer for future work.
- Abstract(参考訳): 高分解能画像生成における深層生成モデルの成功は、実画像のスタイル編集に広く利用されている。
既存のほとんどの手法は、実際の画像を潜在空間に反転させ、制御可能な方向を決定する原理に基づいている。
実画像の反転と制御可能な潜在方向の決定はともに計算的に高価な演算である。
さらに、制御可能な潜伏方向の決定には、さらなる人的監督が必要である。
本研究の目的は,これらのボトルネックに対する解決策として,Deep Generative Modelの潜在空間におけるマスク誘導型特徴変調の有効性を検討することである。
この目的のために,セマンティック・スタイル・オートエンコーダ (SSAE) を提案する。セマンティック・スタイル・オートエンコーダ (SSAE) は,セマンティックマスクを用いた遅延空間操作を利用して,実画像の高度に局所化されたフォトリアリスティックなスタイルの編集を行う。
定性的かつ定量的な結果と解析結果について述べる。
この作業は,将来の作業のガイドプライマーとして機能する。
関連論文リスト
- AdaptiveDrag: Semantic-Driven Dragging on Diffusion-Based Image Editing [14.543341303789445]
マスクレスのポイントベース画像編集手法であるAdaptiveDragを提案する。
入力画像とドラッグプロセスとの包括的接続を確保するため,セマンティック駆動型最適化を開発した。
提案手法は,これらの効果的な設計に基づいて,単一入力画像とハンド・ターゲット・ポイント・ペアのみを用いて,優れた生成結果を提供する。
論文 参考訳(メタデータ) (2024-10-16T15:59:02Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Spatial Steerability of GANs via Self-Supervision from Discriminator [123.27117057804732]
本稿では,GANの空間的ステアビリティを向上させるための自己教師型アプローチを提案する。
具体的には、空間帰納バイアスとして生成モデルの中間層に符号化されるランダムなガウス熱マップを設計する。
推論中、ユーザは直感的に空間のヒートマップと対話し、シーンのレイアウトを調整したり、移動したり、オブジェクトを削除したりすることで、出力画像を編集することができる。
論文 参考訳(メタデータ) (2023-01-20T07:36:29Z) - Attribute-specific Control Units in StyleGAN for Fine-grained Image
Manipulation [57.99007520795998]
特徴マップと変調スタイルの複数のチャネルからなる属性固有制御ユニットを探索する。
具体的には、制御ユニット内の変調スタイルのチャネルと特徴マップを協調的に操作し、意味的および空間的不整合制御を得る。
我々は、特定のスパース方向ベクトルに沿って変調スタイルを移動させ、これらの制御ユニットを操作するために特徴マップを計算するために使用されるフィルタワイズスタイルを置き換える。
論文 参考訳(メタデータ) (2021-11-25T10:42:10Z) - Detect and Locate: A Face Anti-Manipulation Approach with Semantic and
Noise-level Supervision [67.73180660609844]
本稿では,画像中の偽造顔を効率的に検出する,概念的にシンプルだが効果的な方法を提案する。
提案手法は,画像に関する意味の高い意味情報を提供するセグメンテーションマップに依存する。
提案モデルでは,最先端検出精度と顕著なローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2021-07-13T02:59:31Z) - Designing an Encoder for StyleGAN Image Manipulation [38.909059126878354]
最先端の無条件発電機であるStyleGANの潜伏空間について検討する。
そこで我々は,StyleGAN潜在空間における歪み依存性トレードオフと歪み知覚トレードオフの存在を同定し,解析する。
本稿では,実画像の編集を容易にするための2つの原理に基づくエンコーダを提案する。
論文 参考訳(メタデータ) (2021-02-04T17:52:38Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Style Intervention: How to Achieve Spatial Disentanglement with
Style-based Generators? [100.60938767993088]
任意の入力画像に適応し、フレキシブルな目的の下で自然な翻訳効果をレンダリングできる軽量な最適化アルゴリズムを提案する。
フォトリアリズムと一貫性の両方を必要とする高解像度画像の顔属性編集において,提案するフレームワークの性能を検証する。
論文 参考訳(メタデータ) (2020-11-19T07:37:31Z) - Controlling generative models with continuous factors of variations [1.7188280334580197]
生成モデルの潜在空間において有意な方向を求める新しい手法を提案する。
提案手法は人間のアノテーションを必要とせず,生成した画像の単純な変換をコードする方向探索に適している。
論文 参考訳(メタデータ) (2020-01-28T10:04:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。