論文の概要: Domain-Scalable Unpaired Image Translation via Latent Space Anchoring
- arxiv url: http://arxiv.org/abs/2306.14879v1
- Date: Mon, 26 Jun 2023 17:50:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 12:19:39.863117
- Title: Domain-Scalable Unpaired Image Translation via Latent Space Anchoring
- Title(参考訳): 潜在空間アンカーによる領域スカラーアンペア画像変換
- Authors: Siyu Huang, Jie An, Donglai Wei, Zudi Lin, Jiebo Luo, Hanspeter
Pfister
- Abstract要約: Unpaired Image-to-image Translation (UNIT)は、2つの視覚領域間の画像をペアのトレーニングデータなしでマッピングすることを目的としている。
そこで本研究では、潜在空間アンカーと呼ばれる新しい領域スケーリング可能なUNIT手法を提案する。
本手法は, 軽量エンコーダと回帰器モデルを学習することにより, 異なる領域の画像を, 凍ったGANと同じ潜伏空間に固定する。
推論フェーズでは、異なるドメインの学習エンコーダとデコーダを任意に組み合わせて、微調整なしで任意の2つのドメイン間で画像を変換することができる。
- 参考スコア(独自算出の注目度): 88.7642967393508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unpaired image-to-image translation (UNIT) aims to map images between two
visual domains without paired training data. However, given a UNIT model
trained on certain domains, it is difficult for current methods to incorporate
new domains because they often need to train the full model on both existing
and new domains. To address this problem, we propose a new domain-scalable UNIT
method, termed as latent space anchoring, which can be efficiently extended to
new visual domains and does not need to fine-tune encoders and decoders of
existing domains. Our method anchors images of different domains to the same
latent space of frozen GANs by learning lightweight encoder and regressor
models to reconstruct single-domain images. In the inference phase, the learned
encoders and decoders of different domains can be arbitrarily combined to
translate images between any two domains without fine-tuning. Experiments on
various datasets show that the proposed method achieves superior performance on
both standard and domain-scalable UNIT tasks in comparison with the
state-of-the-art methods.
- Abstract(参考訳): unpaired image-to-image translation (unit)は、2つのビジュアルドメイン間の画像をペアトレーニングデータなしでマッピングすることを目的としている。
しかし、特定のドメインでトレーニングされたUNITモデルを考えると、既存のドメインと新しいドメインの両方でフルモデルをトレーニングする必要があるため、現在のメソッドで新しいドメインを組み込むのは難しい。
この問題に対処するため,既存の領域のエンコーダやデコーダの微調整を必要とせず,効率よく新しい視覚領域に拡張できる潜在空間アンカーと呼ばれる新しい領域スケーリング可能なUNIT手法を提案する。
本手法は, 軽量エンコーダと回帰器モデルを学習し, 単一領域画像の再構成を行うことにより, 異なる領域の画像を同じ静止空間に固定する。
推論フェーズでは、異なるドメインの学習エンコーダとデコーダを任意に組み合わせて、微調整なしで任意の2つのドメイン間で画像を変換することができる。
各種データセットに対する実験により,提案手法は,最先端の手法と比較して,標準タスクとドメインスケーリング可能なUNITタスクの両方において優れた性能を発揮することが示された。
関連論文リスト
- Reducing Domain Gap in Frequency and Spatial domain for Cross-modality
Domain Adaptation on Medical Image Segmentation [5.371816551086118]
教師なしドメイン適応(UDA)は、ソースドメインで訓練されたモデルを学び、ラベルなしのターゲットドメインでうまく機能することを目的としています。
本稿では, 周波数及び空間領域移動Uner Multi-Teacher蒸留フレームワークに基づく, 単純かつ効果的なUDA法を提案する。
提案手法は最先端手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2022-11-28T11:35:39Z) - Using Language to Extend to Unseen Domains [81.37175826824625]
ビジョンモデルがデプロイ時に遭遇する可能性のあるすべてのドメインのトレーニングデータを集めることは、費用がかかる。
トレーニングドメインと拡張したいが、堅牢性を改善するためのデータを持っていないドメインを、いかに単純に言葉で表現するかを考えます。
共同画像と言語埋め込み空間を備えたマルチモーダルモデルを用いて、LADSはトレーニング領域から各未確認テスト領域への画像埋め込みの変換を学習する。
論文 参考訳(メタデータ) (2022-10-18T01:14:02Z) - Multi-Scale Multi-Target Domain Adaptation for Angle Closure
Classification [50.658613573816254]
角度閉包分類のためのM2DAN(Multi-scale Multi-target Domain Adversarial Network)を提案する。
異なるスケールでのこれらのドメイン不変性に基づいて、ソースドメインで訓練されたディープモデルは、複数のターゲットドメインの角度クロージャを分類することができる。
論文 参考訳(メタデータ) (2022-08-25T15:27:55Z) - Domain Invariant Masked Autoencoders for Self-supervised Learning from
Multi-domains [73.54897096088149]
マルチドメインからの自己教師型学習のためのドメイン不変のMasked AutoEncoder (DiMAE)を提案する。
中心となる考え方は、入力画像を異なるドメインからのスタイルノイズで拡張し、拡張イメージの埋め込みからイメージを再構築することである。
PACSとDomainNetの実験は、最近の最先端の手法と比較して、DiMAEがかなりの利益を得ていることを示している。
論文 参考訳(メタデータ) (2022-05-10T09:49:40Z) - Dual-Domain Image Synthesis using Segmentation-Guided GAN [33.00724627120716]
2つの異なる領域の特徴を統合した画像合成のためのセグメンテーション誘導手法を提案する。
我々の二重領域モデルで合成された画像は、セマンティックマスク内の1つの領域に属し、残りの領域では別の領域に属します。
論文 参考訳(メタデータ) (2022-04-19T17:25:54Z) - Semantic Consistency in Image-to-Image Translation for Unsupervised
Domain Adaptation [22.269565708490465]
Unsupervised Domain Adaptation (UDA)は、ソースドメインでトレーニングされたモデルを、ラベル付きデータが使用できない新しいターゲットドメインに適応させることを目的としている。
UDAの整合性正規化手法と組み合わせて意味論的に一貫した画像から画像への変換法を提案する。
論文 参考訳(メタデータ) (2021-11-05T14:22:20Z) - Crossing-Domain Generative Adversarial Networks for Unsupervised
Multi-Domain Image-to-Image Translation [12.692904507625036]
複数の領域にまたがる教師なし画像間翻訳のための一般的なフレームワークを提案する。
提案するフレームワークは,一対のエンコーダと一対のGANから構成される。
論文 参考訳(メタデータ) (2020-08-27T01:54:07Z) - GMM-UNIT: Unsupervised Multi-Domain and Multi-Modal Image-to-Image
Translation via Attribute Gaussian Mixture Modeling [66.50914391679375]
unsupervised image-to-image translation (UNIT) は、未経験の訓練画像を用いて、複数の視覚領域間のマッピングを学習することを目的としている。
最近の研究は、複数のドメインで顕著な成功を示しているが、それらは2つの主要な制限に悩まされている。
GMM-UNITという,空間にGMMを組み込むコンテンツ属性不整合表現に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-03-15T10:18:56Z) - Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings [76.85673049332428]
画像とテキストの合同表現の学習は、画像キャプションのようないくつかの重要なドメイン横断タスクのバックボーンを形成する。
ドメイン間の共有情報とドメイン固有の情報を個別にモデル化する,新しい半教師付きフレームワークを提案する。
画像キャプションやテキスト・ツー・イメージ合成など,様々なタスクにおけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-02-16T19:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。