論文の概要: Lipschitz Regularized CycleGAN for Improving Semantic Robustness in
Unpaired Image-to-image Translation
- arxiv url: http://arxiv.org/abs/2012.04932v1
- Date: Wed, 9 Dec 2020 09:28:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 11:43:39.157505
- Title: Lipschitz Regularized CycleGAN for Improving Semantic Robustness in
Unpaired Image-to-image Translation
- Title(参考訳): 画像-画像間翻訳における意味ロバスト性向上のためのリプシッツ正規化サイクルGAN
- Authors: Zhiwei Jia, Bodi Yuan, Kangkang Wang, Hong Wu, David Clifford,
Zhiqiang Yuan, Hao Su
- Abstract要約: 未ペア画像から画像への変換タスクでは、GANベースのアプローチはセマンティックフリップの影響を受けやすい。
セマンティックロバスト性向上のための新しい手法であるLipschitz regularized CycleGANを提案する。
複数の共通データセットに対するアプローチを評価し、既存のGANベースのメソッドと比較する。
- 参考スコア(独自算出の注目度): 19.083671868521918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For unpaired image-to-image translation tasks, GAN-based approaches are
susceptible to semantic flipping, i.e., contents are not preserved
consistently. We argue that this is due to (1) the difference in semantic
statistics between source and target domains and (2) the learned generators
being non-robust. In this paper, we proposed a novel approach, Lipschitz
regularized CycleGAN, for improving semantic robustness and thus alleviating
the semantic flipping issue. During training, we add a gradient penalty loss to
the generators, which encourages semantically consistent transformations. We
evaluate our approach on multiple common datasets and compare with several
existing GAN-based methods. Both quantitative and visual results suggest the
effectiveness and advantage of our approach in producing robust transformations
with fewer semantic flipping.
- Abstract(参考訳): 未ペア画像から画像への変換タスクでは、GANベースのアプローチはセマンティックフリップの影響を受けやすい。
これは、(1)ソースとターゲットドメイン間の意味統計の差異と(2)学習したジェネレータが損なわれないためである。
本稿では,意味的ロバスト性を改善し,意味的フリップ問題を緩和するための新しい手法であるlipschitz regularized cycleganを提案する。
トレーニング中に、ジェネレータに勾配ペナルティ損失を加え、意味的に一貫した変換を促進する。
我々は,複数の共通データセットに対するアプローチを評価し,既存のGANベースの手法と比較した。
定量的および視覚的結果は,意味的なフリップが少なく,堅牢な変換を実現する上でのアプローチの有効性とメリットを示唆している。
関連論文リスト
- General Lipschitz: Certified Robustness Against Resolvable Semantic
Transformations via Transformation-Dependent Randomized Smoothing [6.101765622702223]
構成可能な可解なセマンティック摂動に対してニューラルネットワークを認証する新しいフレームワークであるEmph General Lipschitz (GL)を提案する。
提案手法は,ImageNetデータセットにおける最先端のアプローチと同等に機能する。
論文 参考訳(メタデータ) (2023-08-17T14:39:24Z) - Identical and Fraternal Twins: Fine-Grained Semantic Contrastive
Learning of Sentence Representations [6.265789210037749]
コントラスト学習フレームワークのIdentical Twins と Fraternal Twins を導入する。
また,提案したツインズ・ロスの有効性を証明するために,概念実証実験と対照的な目的を組み合わせる。
論文 参考訳(メタデータ) (2023-07-20T15:02:42Z) - Improving Diffusion-based Image Translation using Asymmetric Gradient
Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。
我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。
実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-07T12:56:56Z) - Towards More Robust Interpretation via Local Gradient Alignment [37.464250451280336]
任意の非負の同質ニューラルネットワークに対して、勾配に対する単純な$ell$-robust criterionは、テクスティノ正規化不変量であることを示す。
我々は,局所勾配の整合性を両立させるために,$ell$とcosine distance-based criteriaを正則化項として組み合わせることを提案する。
我々は,CIFAR-10 と ImageNet-100 でトレーニングしたモデルにより,より堅牢な解釈が得られたことを実験的に示す。
論文 参考訳(メタデータ) (2022-11-29T03:38:28Z) - Diffusion-based Image Translation using Disentangled Style and Content
Representation [51.188396199083336]
セマンティックテキストや単一のターゲット画像でガイドされた拡散ベースの画像変換により、柔軟なスタイル変換が可能になった。
逆拡散中、画像の原内容を維持することはしばしば困難である。
本稿では,不整合スタイルとコンテンツ表現を用いた新しい拡散に基づく教師なし画像翻訳手法を提案する。
提案手法は,テキスト誘導と画像誘導の両方の翻訳作業において,最先端のベースラインモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-30T06:44:37Z) - GSmooth: Certified Robustness against Semantic Transformations via
Generalized Randomized Smoothing [40.38555458216436]
一般的な意味変換に対する堅牢性を証明するための統一的な理論的枠組みを提案する。
GSmoothフレームワークでは,画像と画像の代理ネットワークを用いて複雑な変換を近似するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-09T07:12:17Z) - Diverse Semantic Image Synthesis via Probability Distribution Modeling [103.88931623488088]
新規な多様な意味的画像合成フレームワークを提案する。
本手法は最先端手法と比較して優れた多様性と同等の品質を実現することができる。
論文 参考訳(メタデータ) (2021-03-11T18:59:25Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。