論文の概要: Domain Translation via Latent Space Mapping
- arxiv url: http://arxiv.org/abs/2212.03361v1
- Date: Tue, 6 Dec 2022 23:09:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 15:20:57.196099
- Title: Domain Translation via Latent Space Mapping
- Title(参考訳): 潜在空間マッピングによるドメイン翻訳
- Authors: Tsiry Mayet and Simon Bernard and Clement Chatelain and Romain Herault
- Abstract要約: ラテント空間マッピング(モデル)と呼ばれる新しい統合フレームワークを導入する。
既存のアプローチとは違って,2つのドメイン間の依存関係を学習することで,利用可能なドメインを用いて各潜在空間を規則化することを提案する。
- 参考スコア(独自算出の注目度): 1.1470070927586016
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we investigate the problem of multi-domain translation: given
an element $a$ of domain $A$, we would like to generate a corresponding $b$
sample in another domain $B$, and vice versa. Acquiring supervision in multiple
domains can be a tedious task, also we propose to learn this translation from
one domain to another when supervision is available as a pair $(a,b)\sim
A\times B$ and leveraging possible unpaired data when only $a\sim A$ or only
$b\sim B$ is available. We introduce a new unified framework called Latent
Space Mapping (\model) that exploits the manifold assumption in order to learn,
from each domain, a latent space. Unlike existing approaches, we propose to
further regularize each latent space using available domains by learning each
dependency between pairs of domains. We evaluate our approach in three tasks
performing i) synthetic dataset with image translation, ii) real-world task of
semantic segmentation for medical images, and iii) real-world task of facial
landmark detection.
- Abstract(参考訳): 本稿では,マルチドメイン翻訳の問題について検討する。 1 つの要素 $a$ のドメイン $a$ が与えられたとき,対応する $b$ サンプルを別のドメイン $b$ で生成し,その逆も行う。
複数のドメインにおける監督を得るのは面倒な作業です。また、監督がペア$(a,b)\sim a\times b$として利用可能で、a\sim a$または$b\sim b$しか利用できない場合に、この翻訳をあるドメインから別のドメインへ学ぶことを提案します。
我々は、各領域から潜在空間を学習するために、多様体の仮定を利用するラテント空間マッピング(\model)と呼ばれる新しい統一フレームワークを導入する。
既存のアプローチと異なり,2つのドメイン間の依存関係を学習することにより,利用可能なドメインを用いて各潜在空間をさらに規則化する。
アプローチを3つのタスクで評価し
一 画像翻訳による合成データセット
二 医用画像の意味セグメンテーションの現実世界の課題
三 顔の目印検出の現実世界の業務
関連論文リスト
- A Unified Data Augmentation Framework for Low-Resource Multi-Domain Dialogue Generation [52.0964459842176]
現在の最先端の対話システムは、広範なトレーニングデータセットに大きく依存している。
我々はtextbfAMD$2$G と呼ばれる textbfMulti-textbfDomain textbfDialogue textbfGeneration のための新しいデータ textbfAugmentation フレームワークを提案する。
AMD$2$Gフレームワークは、データ拡張プロセスと、ドメインに依存しないトレーニングとドメイン適応トレーニングという2段階のトレーニングアプローチで構成されている。
論文 参考訳(メタデータ) (2024-06-14T09:52:27Z) - Multiple Noises in Diffusion Model for Semi-Supervised Multi-Domain
Translation [0.6554326244334868]
半教師付き文脈における多ドメイン翻訳のための条件付き拡散フレームワークであるMulti-Domain Diffusion (MDD)を提案する。
従来の方法とは異なり、MDDは入力と出力のドメインを定義する必要はない。
論文 参考訳(メタデータ) (2023-09-25T15:31:16Z) - Domain-Scalable Unpaired Image Translation via Latent Space Anchoring [88.7642967393508]
Unpaired Image-to-image Translation (UNIT)は、2つの視覚領域間の画像をペアのトレーニングデータなしでマッピングすることを目的としている。
そこで本研究では、潜在空間アンカーと呼ばれる新しい領域スケーリング可能なUNIT手法を提案する。
本手法は, 軽量エンコーダと回帰器モデルを学習することにより, 異なる領域の画像を, 凍ったGANと同じ潜伏空間に固定する。
推論フェーズでは、異なるドメインの学習エンコーダとデコーダを任意に組み合わせて、微調整なしで任意の2つのドメイン間で画像を変換することができる。
論文 参考訳(メタデータ) (2023-06-26T17:50:02Z) - Topic-Guided Sampling For Data-Efficient Multi-Domain Stance Detection [44.06173809190896]
スタンス検出は、著者が関心の対象に対して表現する姿勢を特定することに関わる。
このタスクは、ソーシャルメディアの意見の特定から法的主張の立場の検出まで、さまざまな領域にまたがる。
本稿では、トピック誘導型多様性サンプリング手法と、スタンスを微調整するために使用される対照的な目的について述べる。
論文 参考訳(メタデータ) (2023-06-01T15:00:39Z) - Using Language to Extend to Unseen Domains [81.37175826824625]
ビジョンモデルがデプロイ時に遭遇する可能性のあるすべてのドメインのトレーニングデータを集めることは、費用がかかる。
トレーニングドメインと拡張したいが、堅牢性を改善するためのデータを持っていないドメインを、いかに単純に言葉で表現するかを考えます。
共同画像と言語埋め込み空間を備えたマルチモーダルモデルを用いて、LADSはトレーニング領域から各未確認テスト領域への画像埋め込みの変換を学習する。
論文 参考訳(メタデータ) (2022-10-18T01:14:02Z) - Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval [55.122020263319634]
ビデオモーメント検索(VMR)は、与えられた言語クエリに従って、未編集のビデオからターゲットモーメントをローカライズすることを目的としている。
本稿では、新しいタスクであるクロスドメインVMRに焦点を当て、完全なアノテーション付きデータセットをひとつのドメインで利用できるが、関心のあるドメインは、注釈なしのデータセットのみを含む。
本稿では、アノテーションの知識をソースドメインからターゲットドメインに転送するマルチモーダル・クロスドメインアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T12:58:20Z) - Dynamic Instance Domain Adaptation [109.53575039217094]
教師なしのドメイン適応に関するほとんどの研究は、各ドメインのトレーニングサンプルがドメインラベルを伴っていると仮定している。
適応的な畳み込みカーネルを持つ動的ニューラルネットワークを開発し、各インスタンスにドメインに依存しない深い特徴を適応させるために、インスタンス適応残差を生成する。
我々のモデルはDIDA-Netと呼ばれ、複数の一般的な単一ソースおよび複数ソースのUDAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-09T20:05:54Z) - GMM-UNIT: Unsupervised Multi-Domain and Multi-Modal Image-to-Image
Translation via Attribute Gaussian Mixture Modeling [66.50914391679375]
unsupervised image-to-image translation (UNIT) は、未経験の訓練画像を用いて、複数の視覚領域間のマッピングを学習することを目的としている。
最近の研究は、複数のドメインで顕著な成功を示しているが、それらは2つの主要な制限に悩まされている。
GMM-UNITという,空間にGMMを組み込むコンテンツ属性不整合表現に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-03-15T10:18:56Z) - LiDARNet: A Boundary-Aware Domain Adaptation Model for Point Cloud
Semantic Segmentation [18.211513930388417]
我々は、LiDARスキャンフルシーンセマンティックセマンティックセグメンテーション(LiDARNet)のための境界対応ドメイン適応モデルを提案する。
我々のモデルは、ドメインプライベート機能とドメイン共有機能の両方を2ブランチ構造で抽出することができる。
このアプローチを用いることで、両方のドメインで動作する単一のプロジェクションベースのLiDARのフルシーンセマンティックセマンティックセマンティクスモデルが得られる。
論文 参考訳(メタデータ) (2020-03-02T20:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。