論文の概要: Unbalanced Feature Transport for Exemplar-based Image Translation
- arxiv url: http://arxiv.org/abs/2106.10482v1
- Date: Sat, 19 Jun 2021 12:07:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-24 09:02:50.191971
- Title: Unbalanced Feature Transport for Exemplar-based Image Translation
- Title(参考訳): 模擬画像翻訳のための不均衡特徴伝達
- Authors: Fangneng Zhan, Yingchen Yu, Kaiwen Cui, Gongjie Zhang, Shijian Lu,
Jianxiong Pan, Changgong Zhang, Feiying Ma, Xuansong Xie, Chunyan Miao
- Abstract要約: 本稿では,画像翻訳における条件入力とスタイルの類似点間の特徴的アライメントに最適なトランスポートを組み込んだ一般画像翻訳フレームワークを提案する。
本手法は,最先端技術と比較して質的,定量的に優れた画像翻訳を実現する。
- 参考スコア(独自算出の注目度): 51.54421432912801
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the great success of GANs in images translation with different
conditioned inputs such as semantic segmentation and edge maps, generating
high-fidelity realistic images with reference styles remains a grand challenge
in conditional image-to-image translation. This paper presents a general image
translation framework that incorporates optimal transport for feature alignment
between conditional inputs and style exemplars in image translation. The
introduction of optimal transport mitigates the constraint of many-to-one
feature matching significantly while building up accurate semantic
correspondences between conditional inputs and exemplars. We design a novel
unbalanced optimal transport to address the transport between features with
deviational distributions which exists widely between conditional inputs and
exemplars. In addition, we design a semantic-activation normalization scheme
that injects style features of exemplars into the image translation process
successfully. Extensive experiments over multiple image translation tasks show
that our method achieves superior image translation qualitatively and
quantitatively as compared with the state-of-the-art.
- Abstract(参考訳): 意味セグメンテーションやエッジマップといった異なる条件付き入力を持つ画像翻訳におけるgansの成功にもかかわらず、参照スタイルを持つ高忠実なリアルな画像を生成することは、条件付き画像対画像翻訳において大きな課題である。
本稿では,画像翻訳における条件付き入力とスタイルの例題間の機能アライメントに最適なトランスポートを組み込んだ汎用画像翻訳フレームワークを提案する。
最適輸送の導入は、条件入力と例間の正確な意味対応を構築しながら、多対一の特徴マッチングの制約を著しく緩和する。
我々は,条件入力と例間に存在する偏差分布を持つ特徴間の輸送に対処する,新しい不均衡な最適輸送を設計する。
さらに,画像翻訳プロセスにexemplarのスタイル特徴をうまく注入する意味的活性化正規化スキームを設計する。
複数の画像翻訳タスクに関する広範囲な実験により,本手法は最先端と比較して質的かつ定量的に優れた画像翻訳を実現することが示された。
関連論文リスト
- Optimal Image Transport on Sparse Dictionaries [2.7855886538423182]
Sparse Representation (SR) とOptimal Transport (OT) を利用して、スパース辞書上の新しい最適な画像転送アルゴリズムを導出する。
画像色変換や芸術的スタイル変換など,画像から画像への変換作業における多目的性や多くの利点を実証し、写真リアルな変換効果を示す。
論文 参考訳(メタデータ) (2023-11-03T15:37:01Z) - Improving Diffusion-based Image Translation using Asymmetric Gradient
Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。
我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。
実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-07T12:56:56Z) - Vector Quantized Image-to-Image Translation [31.65282783830092]
本稿では,ベクトル量子化手法を画像から画像への変換フレームワークに導入することを提案する。
我々のフレームワークは、最新の画像から画像への変換や画像拡張手法に匹敵する性能を実現している。
論文 参考訳(メタデータ) (2022-07-27T04:22:29Z) - Pretraining is All You Need for Image-to-Image Translation [59.43151345732397]
画像から画像への一般的な翻訳を促進するために,事前学習を使うことを提案する。
提案した事前学習型画像画像変換(PITI)は,前例のないリアリズムと忠実さのイメージを合成できることを示す。
論文 参考訳(メタデータ) (2022-05-25T17:58:26Z) - Unsupervised Image-to-Image Translation with Generative Prior [103.54337984566877]
教師なし画像画像変換は、ペアデータなしで2つの視覚領域間の翻訳を学習することを目的としている。
本稿では,GP-UNIT(Generative Prior-guided UN Image-to-image Translation)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-07T17:59:23Z) - Marginal Contrastive Correspondence for Guided Image Generation [58.0605433671196]
例題に基づく画像翻訳は、条件入力と2つの異なる領域からの例題間の密接な対応を確立する。
既存の作業は、2つのドメインにまたがる機能的距離を最小化することで、ドメイン間の通信を暗黙的に構築する。
本稿では,MCL-Net(Marginal Contrastive Learning Network)の設計を行った。
論文 参考訳(メタデータ) (2022-04-01T13:55:44Z) - Semi-Supervised Image-to-Image Translation using Latent Space Mapping [37.232496213047845]
半教師付き画像翻訳のための一般的なフレームワークを提案する。
私たちの一番の考え方は、画像空間ではなく、潜在機能空間の翻訳を学ぶことです。
低次元の特徴空間のおかげで、所望の写像関数を見つけるのが容易である。
論文 参考訳(メタデータ) (2022-03-29T05:14:26Z) - Smoothing the Disentangled Latent Style Space for Unsupervised
Image-to-Image Translation [56.55178339375146]
イメージ・ツー・イメージ(I2I)マルチドメイン翻訳モデルは通常、セマンティックな結果の品質を用いて評価される。
本稿では,翻訳ネットワークがスムーズでゆがみのあるラテントスタイル空間を学習するのに役立つ,3つの特定の損失に基づく新たなトレーニングプロトコルを提案する。
論文 参考訳(メタデータ) (2021-06-16T17:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。