論文の概要: Toward a Controllable Disentanglement Network
- arxiv url: http://arxiv.org/abs/2001.08572v3
- Date: Sat, 20 Jun 2020 04:02:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 17:56:46.355368
- Title: Toward a Controllable Disentanglement Network
- Title(参考訳): 制御可能な絡み合いネットワークを目指して
- Authors: Zengjie Song, Oluwasanmi Koyejo, Jiangshe Zhang
- Abstract要約: 本稿では, 画像編集における歪みの程度を制御し, 歪み強度と復元品質のバランスをとることにより, 歪み画像表現を学習する2つの重要な問題に対処する。
ソフトターゲット表現の実際の値空間を探索することにより、指定された特性を持つ新規な画像を合成することができる。
- 参考スコア(独自算出の注目度): 22.968760397814993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses two crucial problems of learning disentangled image
representations, namely controlling the degree of disentanglement during image
editing, and balancing the disentanglement strength and the reconstruction
quality. To encourage disentanglement, we devise a distance covariance based
decorrelation regularization. Further, for the reconstruction step, our model
leverages a soft target representation combined with the latent image code. By
exploring the real-valued space of the soft target representation, we are able
to synthesize novel images with the designated properties. To improve the
perceptual quality of images generated by autoencoder (AE)-based models, we
extend the encoder-decoder architecture with the generative adversarial network
(GAN) by collapsing the AE decoder and the GAN generator into one. We also
design a classification based protocol to quantitatively evaluate the
disentanglement strength of our model. Experimental results showcase the
benefits of the proposed model.
- Abstract(参考訳): 本稿では, 画像編集における歪みの程度を制御し, 歪み強度と復元品質のバランスをとることにより, 歪み画像表現を学習する2つの重要な問題に対処する。
絡み合いを促進するために,距離共分散に基づく相関正規化を考案する。
さらに, 復元ステップでは, ソフトターゲット表現と潜在画像コードを組み合わせた表現を用いる。
ソフトターゲット表現の実数値空間を探索することで,指定された特性を持つ新しい画像を合成することができる。
オートエンコーダ(AE)モデルにより生成された画像の知覚品質を改善するため,AEデコーダとGANジェネレータを1つに折り畳むことで,エンコーダ・デコーダアーキテクチャをGAN(Generative Adversarial Network)に拡張する。
また,モデルの絡み合う強度を定量的に評価するための分類ベースのプロトコルを設計する。
実験の結果,提案モデルの利点が示された。
関連論文リスト
- A Compact and Semantic Latent Space for Disentangled and Controllable
Image Editing [4.8201607588546]
本稿では,StyleGANの潜在空間を再編成するオートエンコーダを提案する。
提案手法は,同一性に関して元の画像に対する忠実さを維持しつつ,競合する手法よりも不整合性が高いことを示す。
論文 参考訳(メタデータ) (2023-12-13T16:18:45Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - CM-GAN: Image Inpainting with Cascaded Modulation GAN and Object-Aware
Training [112.96224800952724]
複雑な画像に大きな穴をあける際の可視像構造を生成するためのカスケード変調GAN(CM-GAN)を提案する。
各デコーダブロックにおいて、まず大域変調を適用し、粗い意味認識合成構造を行い、次に大域変調の出力に空間変調を適用し、空間適応的に特徴写像を更に調整する。
さらに,ネットワークがホール内の新たな物体を幻覚させるのを防ぐため,実世界のシナリオにおける物体除去タスクのニーズを満たすために,オブジェクト認識型トレーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-03-22T16:13:27Z) - Toward Interactive Modulation for Photo-Realistic Image Restoration [16.610981587637102]
画像復元レベルの調整は、復元強度を表す因子を変更して復元画像を生成することを目指しています。
本稿では、変調タスクで高周波テクスチャを生成する制御可能なUnetGenerative Adversarial Network (CUGAN)を提案する。
論文 参考訳(メタデータ) (2021-05-07T07:05:56Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - Improving Augmentation and Evaluation Schemes for Semantic Image
Synthesis [16.097324852253912]
本稿では,GAN(Generative Adversarial Network)に特化して設計された新しい拡張方式を提案する。
本稿では,ジェネレータへの入力として使用するセマンティックラベルマップのオブジェクト形状をランダムにワープする。
ワープされたラベルマップと非ワープされたラベルマップと画像の間の局所的な形状の相違により、GANはシーンの構造的および幾何学的詳細をよりよく学習することができる。
論文 参考訳(メタデータ) (2020-11-25T10:55:26Z) - LT-GAN: Self-Supervised GAN with Latent Transformation Detection [10.405721171353195]
画像の生成品質と多様性を改善するための自己教師付きアプローチ(LT-GAN)を提案する。
我々は,提案するLT-GANが,他の最先端のトレーニング技術と効果的に組み合わせて,付加的なメリットを享受できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-10-19T22:09:45Z) - Multi-Scale Boosted Dehazing Network with Dense Feature Fusion [92.92572594942071]
U-Netアーキテクチャに基づくDense Feature Fusionを用いたマルチスケールブーストデハージングネットワークを提案する。
提案モデルでは,ベンチマークデータセットや実世界のハジー画像に対する最先端のアプローチに対して,好意的に機能することを示す。
論文 参考訳(メタデータ) (2020-04-28T09:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。