論文の概要: Semi-Supervised Image-to-Image Translation using Latent Space Mapping
- arxiv url: http://arxiv.org/abs/2203.15241v1
- Date: Tue, 29 Mar 2022 05:14:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-30 15:15:16.794078
- Title: Semi-Supervised Image-to-Image Translation using Latent Space Mapping
- Title(参考訳): 潜時空間マッピングを用いた半スーパービジョン画像間変換
- Authors: Pan Zhang, Jianmin Bao, Ting Zhang, Dong Chen, Fang Wen
- Abstract要約: 半教師付き画像翻訳のための一般的なフレームワークを提案する。
私たちの一番の考え方は、画像空間ではなく、潜在機能空間の翻訳を学ぶことです。
低次元の特徴空間のおかげで、所望の写像関数を見つけるのが容易である。
- 参考スコア(独自算出の注目度): 37.232496213047845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent image-to-image translation works have been transferred from supervised
to unsupervised settings due to the expensive cost of capturing or labeling
large amounts of paired data. However, current unsupervised methods using the
cycle-consistency constraint may not find the desired mapping, especially for
difficult translation tasks. On the other hand, a small number of paired data
are usually accessible. We therefore introduce a general framework for
semi-supervised image translation. Unlike previous works, our main idea is to
learn the translation over the latent feature space instead of the image space.
Thanks to the low dimensional feature space, it is easier to find the desired
mapping function, resulting in improved quality of translation results as well
as the stability of the translation model. Empirically we show that using
feature translation generates better results, even using a few bits of paired
data. Experimental comparisons with state-of-the-art approaches demonstrate the
effectiveness of the proposed framework on a variety of challenging
image-to-image translation tasks
- Abstract(参考訳): 最近の画像から画像への翻訳は、大量のペアデータのキャプチャやラベル付けのコストがかかるため、教師なしから教師なしに移された。
しかし、サイクル整合性制約を用いた現在の教師なし手法では、特に難しい翻訳タスクにおいて、望ましいマッピングが見つからない場合がある。
一方、少数のペアデータは通常アクセス可能である。
そこで我々は,半教師付き画像翻訳のための一般的なフレームワークを導入する。
以前の作品とは異なり、私たちの主なアイデアは、画像空間の代わりに潜在特徴空間上の翻訳を学ぶことです。
低次元の特徴空間により、所望のマッピング関数を見つけやすくなり、結果として翻訳結果の品質が向上し、翻訳モデルの安定性が向上する。
実験として,数ビットのペアデータであっても,機能翻訳がよりよい結果を生み出すことを示す。
画像から画像への様々な翻訳課題における提案フレームワークの有効性を実証する最先端手法との比較
関連論文リスト
- Exploring Semantic Consistency in Unpaired Image Translation to Generate
Data for Surgical Applications [1.8011391924021904]
本研究では,外科的応用における適切なデータを生成するための画像翻訳手法を実験的に検討した。
構造相似性損失と対照的学習の単純な組み合わせが、最も有望な結果をもたらすことがわかった。
論文 参考訳(メタデータ) (2023-09-06T14:43:22Z) - Unsupervised Image-to-Image Translation with Generative Prior [103.54337984566877]
教師なし画像画像変換は、ペアデータなしで2つの視覚領域間の翻訳を学習することを目的としている。
本稿では,GP-UNIT(Generative Prior-guided UN Image-to-image Translation)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-07T17:59:23Z) - Unbalanced Feature Transport for Exemplar-based Image Translation [51.54421432912801]
本稿では,画像翻訳における条件入力とスタイルの類似点間の特徴的アライメントに最適なトランスポートを組み込んだ一般画像翻訳フレームワークを提案する。
本手法は,最先端技術と比較して質的,定量的に優れた画像翻訳を実現する。
論文 参考訳(メタデータ) (2021-06-19T12:07:48Z) - Smoothing the Disentangled Latent Style Space for Unsupervised
Image-to-Image Translation [56.55178339375146]
イメージ・ツー・イメージ(I2I)マルチドメイン翻訳モデルは通常、セマンティックな結果の品質を用いて評価される。
本稿では,翻訳ネットワークがスムーズでゆがみのあるラテントスタイル空間を学習するのに役立つ,3つの特定の損失に基づく新たなトレーニングプロトコルを提案する。
論文 参考訳(メタデータ) (2021-06-16T17:58:21Z) - The Spatially-Correlative Loss for Various Image Translation Tasks [69.62228639870114]
シーン構造の一貫性を保つために、シンプルで効率的かつ効果的な新しい空間相関損失を提案します。
以前の方法は、ピクセルレベルのサイクル一貫性または特徴レベルのマッチング損失を使用してこれを試みます。
I2I翻訳の3つのモードすべてにおいて,ベースラインモデルに対して,単一モーダル,マルチモーダル,さらには単一イメージ翻訳において,明確な改善が見られた。
論文 参考訳(メタデータ) (2021-04-02T02:13:30Z) - Multiple GAN Inversion for Exemplar-based Image-to-Image Translation [0.0]
実例に基づく画像-画像変換のための複数GANインバージョンを提案する。
提案するMultiple GAN Inversionは,階層数選択における自己決定アルゴリズムによる人間の介入を回避する。
実験結果から,提案手法の利点を既存の最先端の画像画像変換法と比較した。
論文 参考訳(メタデータ) (2021-03-26T13:46:14Z) - Rethinking the Truly Unsupervised Image-to-Image Translation [29.98784909971291]
教師なし画像画像変換モデル(TUNIT)は、画像領域を分離し、入力画像を推定領域に変換する。
実験結果から、TUNITはフルラベルでトレーニングされたセットレベルの教師付きモデルと同等またはそれ以上のパフォーマンスを達成することが示された。
TUNITはラベル付きデータで簡単にセミ教師付き学習に拡張できる。
論文 参考訳(メタデータ) (2020-06-11T15:15:12Z) - Semi-supervised Learning for Few-shot Image-to-Image Translation [89.48165936436183]
本稿では,SEMITと呼ばれる画像翻訳のための半教師付き手法を提案する。
提案手法は,ソースラベルの10%以下を用いて,4つの異なるデータセットに対して優れた結果を得る。
論文 参考訳(メタデータ) (2020-03-30T22:46:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。