論文の概要: Lipschitz Regularized CycleGAN for Improving Semantic Robustness in
Unpaired Image-to-image Translation
- arxiv url: http://arxiv.org/abs/2012.04932v1
- Date: Wed, 9 Dec 2020 09:28:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 11:43:39.157505
- Title: Lipschitz Regularized CycleGAN for Improving Semantic Robustness in
Unpaired Image-to-image Translation
- Title(参考訳): 画像-画像間翻訳における意味ロバスト性向上のためのリプシッツ正規化サイクルGAN
- Authors: Zhiwei Jia, Bodi Yuan, Kangkang Wang, Hong Wu, David Clifford,
Zhiqiang Yuan, Hao Su
- Abstract要約: 未ペア画像から画像への変換タスクでは、GANベースのアプローチはセマンティックフリップの影響を受けやすい。
セマンティックロバスト性向上のための新しい手法であるLipschitz regularized CycleGANを提案する。
複数の共通データセットに対するアプローチを評価し、既存のGANベースのメソッドと比較する。
- 参考スコア(独自算出の注目度): 19.083671868521918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For unpaired image-to-image translation tasks, GAN-based approaches are
susceptible to semantic flipping, i.e., contents are not preserved
consistently. We argue that this is due to (1) the difference in semantic
statistics between source and target domains and (2) the learned generators
being non-robust. In this paper, we proposed a novel approach, Lipschitz
regularized CycleGAN, for improving semantic robustness and thus alleviating
the semantic flipping issue. During training, we add a gradient penalty loss to
the generators, which encourages semantically consistent transformations. We
evaluate our approach on multiple common datasets and compare with several
existing GAN-based methods. Both quantitative and visual results suggest the
effectiveness and advantage of our approach in producing robust transformations
with fewer semantic flipping.
- Abstract(参考訳): 未ペア画像から画像への変換タスクでは、GANベースのアプローチはセマンティックフリップの影響を受けやすい。
これは、(1)ソースとターゲットドメイン間の意味統計の差異と(2)学習したジェネレータが損なわれないためである。
本稿では,意味的ロバスト性を改善し,意味的フリップ問題を緩和するための新しい手法であるlipschitz regularized cycleganを提案する。
トレーニング中に、ジェネレータに勾配ペナルティ損失を加え、意味的に一貫した変換を促進する。
我々は,複数の共通データセットに対するアプローチを評価し,既存のGANベースの手法と比較した。
定量的および視覚的結果は,意味的なフリップが少なく,堅牢な変換を実現する上でのアプローチの有効性とメリットを示唆している。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow [94.90853153808987]
セマンティックセグメンテーション(Semantic segmentation)とセマンティックイメージ合成(Semantic image synthesis)は、視覚知覚と生成において代表的なタスクである。
我々は、統一されたフレームワーク(SemFlow)を提案し、それらを2つの逆問題としてモデル化する。
実験の結果,セマンティックセグメンテーションとセマンティック画像合成タスクにおいて,セマンティックセグメンテーションと競合する結果が得られた。
論文 参考訳(メタデータ) (2024-05-30T17:34:40Z) - StegoGAN: Leveraging Steganography for Non-Bijective Image-to-Image Translation [18.213286385769525]
CycleGANベースの手法は、生成した画像のミスマッチした情報を隠して、サイクル一貫性の目的をバイパスすることが知られている。
本稿では,ステガノグラフィーを利用した新しいモデルであるStegoGANを紹介した。
我々のアプローチは、追加の後処理や監督を必要とすることなく、翻訳画像のセマンティック一貫性を高める。
論文 参考訳(メタデータ) (2024-03-29T12:23:58Z) - General Lipschitz: Certified Robustness Against Resolvable Semantic Transformations via Transformation-Dependent Randomized Smoothing [5.5855074442298696]
構成可能な可解なセマンティック摂動に対してニューラルネットワークを認証する新しいフレームワークであるEmph General Lipschitz (GL)を提案する。
提案手法は,ImageNetデータセットにおける最先端のアプローチと同等に機能する。
論文 参考訳(メタデータ) (2023-08-17T14:39:24Z) - Identical and Fraternal Twins: Fine-Grained Semantic Contrastive
Learning of Sentence Representations [6.265789210037749]
コントラスト学習フレームワークのIdentical Twins と Fraternal Twins を導入する。
また,提案したツインズ・ロスの有効性を証明するために,概念実証実験と対照的な目的を組み合わせる。
論文 参考訳(メタデータ) (2023-07-20T15:02:42Z) - Improving Diffusion-based Image Translation using Asymmetric Gradient
Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。
我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。
実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-07T12:56:56Z) - GSmooth: Certified Robustness against Semantic Transformations via
Generalized Randomized Smoothing [40.38555458216436]
一般的な意味変換に対する堅牢性を証明するための統一的な理論的枠組みを提案する。
GSmoothフレームワークでは,画像と画像の代理ネットワークを用いて複雑な変換を近似するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-09T07:12:17Z) - Diverse Semantic Image Synthesis via Probability Distribution Modeling [103.88931623488088]
新規な多様な意味的画像合成フレームワークを提案する。
本手法は最先端手法と比較して優れた多様性と同等の品質を実現することができる。
論文 参考訳(メタデータ) (2021-03-11T18:59:25Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。