論文の概要: Guided Image-to-Image Translation by Discriminator-Generator
Communication
- arxiv url: http://arxiv.org/abs/2303.03598v1
- Date: Tue, 7 Mar 2023 02:29:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 16:44:56.433161
- Title: Guided Image-to-Image Translation by Discriminator-Generator
Communication
- Title(参考訳): ディスクリミネータ・ジェネレータ通信によるガイド画像から画像への変換
- Authors: Yuanjiang Cao, Lina Yao, Le Pan, Quan Z. Sheng, and Xiaojun Chang
- Abstract要約: Image-to-image (I2I) 翻訳の目標は、ソースドメインからターゲットドメインに画像を転送することである。
本研究の主な分野は,GAN(Generative Adversarial Network)に基づくI2I翻訳の定式化である。
- 参考スコア(独自算出の注目度): 71.86347329356244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of Image-to-image (I2I) translation is to transfer an image from a
source domain to a target domain, which has recently drawn increasing
attention. One major branch of this research is to formulate I2I translation
based on Generative Adversarial Network (GAN). As a zero-sum game, GAN can be
reformulated as a Partially-observed Markov Decision Process (POMDP) for
generators, where generators cannot access full state information of their
environments. This formulation illustrates the information insufficiency in the
GAN training. To mitigate this problem, we propose to add a communication
channel between discriminators and generators. We explore multiple architecture
designs to integrate the communication mechanism into the I2I translation
framework. To validate the performance of the proposed approach, we have
conducted extensive experiments on various benchmark datasets. The experimental
results confirm the superiority of our proposed method.
- Abstract(参考訳): 画像から画像への変換(i2i)の目的は、最近注目を集めているソースドメインからターゲットドメインに画像を転送することである。
本研究の主な分野は,GAN(Generative Adversarial Network)に基づくI2I翻訳の定式化である。
ゼロサムゲームとして、ジェネレータは環境の完全な状態情報にアクセスできない部分保存マルコフ決定プロセス(POMDP)として再構成することができる。
この定式化は、GAN訓練における情報不足を示している。
この問題を軽減するため,識別器とジェネレータ間の通信チャネルの追加を提案する。
通信機構をi2i翻訳フレームワークに統合する複数のアーキテクチャ設計について検討する。
提案手法の性能を検証するため,様々なベンチマークデータセットについて広範な実験を行った。
実験の結果,提案手法の優位性が確認された。
関連論文リスト
- I2I-Galip: Unsupervised Medical Image Translation Using Generative Adversarial CLIP [30.506544165999564]
ペアの例が存在しないため、画像から画像への翻訳は難しい作業である。
我々はイメージ・ツー・イメージ・ジェネレーティブ・アドバイザリアル・CLIP (I2I-Galip) という新しい画像・画像変換フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-19T01:44:50Z) - SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial
Network for an end-to-end image translation [18.93434486338439]
SCONE-GANはリアルで多様な風景画像を生成する学習に有効であることが示されている。
より現実的で多様な画像生成のために、スタイル参照画像を導入します。
画像から画像への変換と屋外画像のスタイリングのための提案アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-11-07T10:29:16Z) - IR-GAN: Image Manipulation with Linguistic Instruction by Increment
Reasoning [110.7118381246156]
Incrment Reasoning Generative Adversarial Network (IR-GAN)は、画像における視覚的インクリメントと命令における意味的インクリメントとの整合性を推論することを目的としている。
まず,単語レベルと命令レベルの命令エンコーダを導入し,履歴関連命令からユーザの意図を意味的インクリメントとして学習する。
第2に、対象画像を生成するために、意味的インクリメントの表現をソースイメージに組み込んで、ソースイメージが補助的参照の役割を担っている。
論文 参考訳(メタデータ) (2022-04-02T07:48:39Z) - Gated SwitchGAN for multi-domain facial image translation [12.501699058042439]
本稿では,より適応的な識別器構造と一致した生成器を備えたスイッチ生成逆数ネットワーク(SwitchGAN)を提案し,微妙な画像変換を行う。
条件付きモジュールにおける特徴選択と融合を実現するために,特徴切替操作を提案する。
Morph, RaFD, CelebAデータベースを用いた実験により, 我々の拡張SwitchGANは, StarGAN, AttGAN, STGANよりも優れた翻訳結果が得られることを示した。
論文 参考訳(メタデータ) (2021-11-28T10:24:43Z) - Unsupervised Image-to-Image Translation via Pre-trained StyleGAN2
Network [73.5062435623908]
本稿では,一連のモデル変換によって対象領域に新たなモデルを生成する新しいI2I翻訳手法を提案する。
潜在ベクトルを生成されたモデルに入力することで、ソースドメインとターゲットドメインの間でI2I翻訳を行うことができる。
論文 参考訳(メタデータ) (2020-10-12T13:51:40Z) - MI^2GAN: Generative Adversarial Network for Medical Image Domain
Adaptation using Mutual Information Constraint [47.07869311690419]
本稿では,ドメイン間I2I翻訳中に画像コンテンツを保持する新しいGANを提案する。
特に、ソース画像と翻訳画像の両方のドメイン情報からコンテンツ特徴を分離する。
提案したMI$2$GANは,大腸内視鏡画像を用いたポリープセグメンテーションと,眼底画像における光ディスクとカップのセグメンテーションの2つの課題について評価した。
論文 参考訳(メタデータ) (2020-07-22T03:19:54Z) - A U-Net Based Discriminator for Generative Adversarial Networks [86.67102929147592]
GAN(Generative Adversarial Network)のための代替U-Netベースの識別器アーキテクチャを提案する。
提案アーキテクチャにより,合成画像のグローバルコヒーレンスを維持しつつ,画素単位の詳細なフィードバックを生成元に提供することができる。
斬新な判別器は、標準分布と画像品質の指標の観点から、最先端の技術を向上する。
論文 参考訳(メタデータ) (2020-02-28T11:16:54Z) - Multi-Channel Attention Selection GANs for Guided Image-to-Image
Translation [148.9985519929653]
本稿では,画像から画像への変換のためのマルチチャネルアテンション選択生成支援ネットワーク(SelectionGAN)を提案する。
提案するフレームワークとモジュールは統合されたソリューションであり、セマンティック画像合成などの他の生成タスクに応用できる。
論文 参考訳(メタデータ) (2020-02-03T23:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。