論文の概要: Emerging Disentanglement in Auto-Encoder Based Unsupervised Image
Content Transfer
- arxiv url: http://arxiv.org/abs/2001.05017v1
- Date: Tue, 14 Jan 2020 19:36:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 12:16:34.382931
- Title: Emerging Disentanglement in Auto-Encoder Based Unsupervised Image
Content Transfer
- Title(参考訳): オートエンコーダに基づく教師なし画像コンテンツ転送における新たな絡み合い
- Authors: Ori Press, Tomer Galanti, Sagie Benaim, Lior Wolf
- Abstract要約: 我々は、AドメインとBドメインの間の教師なしの方法でマッピングする学習の課題について研究する。
本ソリューションでは,2経路エンコーダを1つ,デコーダを1つ採用している。
- 参考スコア(独自算出の注目度): 94.81925300137773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of learning to map, in an unsupervised way, between
domains A and B, such that the samples b in B contain all the information that
exists in samples a in A and some additional information. For example, ignoring
occlusions, B can be people with glasses, A people without, and the glasses,
would be the added information. When mapping a sample a from the first domain
to the other domain, the missing information is replicated from an independent
reference sample b in B. Thus, in the above example, we can create, for every
person without glasses a version with the glasses observed in any face image.
Our solution employs a single two-pathway encoder and a single decoder for
both domains. The common part of the two domains and the separate part are
encoded as two vectors, and the separate part is fixed at zero for domain A.
The loss terms are minimal and involve reconstruction losses for the two
domains and a domain confusion term. Our analysis shows that under mild
assumptions, this architecture, which is much simpler than the literature
guided-translation methods, is enough to ensure disentanglement between the two
domains. We present convincing results in a few visual domains, such as
no-glasses to glasses, adding facial hair based on a reference image, etc.
- Abstract(参考訳): 我々は、A のサンプル b が A のサンプル a に存在する全ての情報といくつかの追加情報を含むように、A と B の間の教師なしの方法で写像を学習する問題を研究する。
例えば、オクルージョンを無視して、Bは眼鏡をかけた人、Aは眼鏡をかけていない人、そしてBは追加情報となる。
第1のドメインから他のドメインにサンプルaをマッピングすると、b内の独立した参照サンプルbから不足した情報が複製される。
本ソリューションでは,2経路エンコーダを1つ,デコーダを1つ採用している。
2つの領域の共通部分と分離部分の共通部分は2つのベクトルとして符号化され、分離部分はドメインAに対してゼロで固定される。
我々の分析により, 軽度な仮定の下では, このアーキテクチャは, 文学的指導翻訳法よりもはるかに単純であり, 2つの領域間の絡み合いを保証するのに十分であることが示された。
眼鏡なし,参照画像に基づく顔毛の追加など,いくつかの視覚領域において説得力のある結果を提示する。
関連論文リスト
- WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization [63.98650220772378]
We present WIDIn, Wording Images for Domain-Invariant representation, to disentangleative discriminative visual representation。
まず、ドメイン固有の言語を適応的に識別し、削除するために使用可能な、きめ細かいアライメントを組み込んだ言語を推定する。
WIDInは、CLIPのような事前訓練された視覚言語モデルと、MoCoやBERTのような個別訓練されたユニモーダルモデルの両方に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-05-28T17:46:27Z) - SynCDR : Training Cross Domain Retrieval Models with Synthetic Data [69.26882668598587]
クロスドメイン検索では、同じ意味圏から2つの視覚領域にまたがるイメージを識別するためにモデルが必要である。
我々は、これらの欠落したカテゴリの例を満たすために、ドメイン間で合成データを生成する方法を示す。
最高のSynCDRモデルは、先行技術よりも最大15%パフォーマンスが向上します。
論文 参考訳(メタデータ) (2023-12-31T08:06:53Z) - Domain-Scalable Unpaired Image Translation via Latent Space Anchoring [88.7642967393508]
Unpaired Image-to-image Translation (UNIT)は、2つの視覚領域間の画像をペアのトレーニングデータなしでマッピングすることを目的としている。
そこで本研究では、潜在空間アンカーと呼ばれる新しい領域スケーリング可能なUNIT手法を提案する。
本手法は, 軽量エンコーダと回帰器モデルを学習することにより, 異なる領域の画像を, 凍ったGANと同じ潜伏空間に固定する。
推論フェーズでは、異なるドメインの学習エンコーダとデコーダを任意に組み合わせて、微調整なしで任意の2つのドメイン間で画像を変換することができる。
論文 参考訳(メタデータ) (2023-06-26T17:50:02Z) - WUDA: Unsupervised Domain Adaptation Based on Weak Source Domain Labels [5.718326013810649]
セマンティックセグメンテーションのための教師なしドメイン適応(UDA)は、細かなソースドメインラベルを持つクロスドメイン問題に対処する。
本稿では、弱ソースドメインラベルに基づく教師なしドメイン適応という新しいタスクを定義する。
論文 参考訳(メタデータ) (2022-10-05T08:28:57Z) - Domain Camera Adaptation and Collaborative Multiple Feature Clustering for Unsupervised Person Re-ID [5.212394574743209]
教師なしの人物再識別(re-ID)は、限られたデータが利用可能なオープンワールドシナリオ設定のために、多くの注目を集めている。
既存の教師なし手法は、しばしば目に見えない領域でうまく一般化できないが、教師なし手法は、主に複数の粒度情報がなく、確認バイアスに悩まされる傾向がある。
本稿では,1)ラベル付きソースドメイン上で教師なしドメイン適応を行い,2)ラベル付きターゲットドメイン上での潜在的類似点のマイニングを行う。
論文 参考訳(メタデータ) (2022-08-18T03:56:48Z) - Dual-Domain Image Synthesis using Segmentation-Guided GAN [33.00724627120716]
2つの異なる領域の特徴を統合した画像合成のためのセグメンテーション誘導手法を提案する。
我々の二重領域モデルで合成された画像は、セマンティックマスク内の1つの領域に属し、残りの領域では別の領域に属します。
論文 参考訳(メタデータ) (2022-04-19T17:25:54Z) - Cross-domain Contrastive Learning for Unsupervised Domain Adaptation [108.63914324182984]
教師なしドメイン適応(Unsupervised domain adapt、UDA)は、完全にラベル付けされたソースドメインから異なるラベル付けされていないターゲットドメインに学習した知識を転送することを目的としている。
対照的な自己教師型学習に基づいて、トレーニングとテストセット間のドメインの相違を低減するために、機能を整列させます。
論文 参考訳(メタデータ) (2021-06-10T06:32:30Z) - Differential Treatment for Stuff and Things: A Simple Unsupervised
Domain Adaptation Method for Semantic Segmentation [105.96860932833759]
最先端のアプローチは、セマンティックレベルのアライメントの実行がドメインシフトの問題に取り組むのに役立つことを証明している。
我々は,物事領域や物事に対する異なる戦略による意味レベルのアライメントを改善することを提案する。
提案手法に加えて,提案手法は,ソースとターゲットドメイン間の最も類似した機能やインスタンス機能を最小化することにより,この問題の緩和に有効であることを示す。
論文 参考訳(メタデータ) (2020-03-18T04:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。