論文の概要: Disentangled Unsupervised Image Translation via Restricted Information
Flow
- arxiv url: http://arxiv.org/abs/2111.13279v1
- Date: Fri, 26 Nov 2021 00:27:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 02:03:03.557762
- Title: Disentangled Unsupervised Image Translation via Restricted Information
Flow
- Title(参考訳): 制限情報フローによる非教師付き画像翻訳
- Authors: Ben Usman, Dina Bashkirova, Kate Saenko
- Abstract要約: 多くの最先端のメソッドは、所望の共有vs固有の分割をアーキテクチャにハードコードする。
帰納的アーキテクチャバイアスに依存しない新しい手法を提案する。
提案手法は,2つの合成データセットと1つの自然なデータセットに対して一貫した高い操作精度を実現する。
- 参考スコア(独自算出の注目度): 61.44666983942965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised image-to-image translation methods aim to map images from one
domain into plausible examples from another domain while preserving structures
shared across two domains. In the many-to-many setting, an additional guidance
example from the target domain is used to determine domain-specific attributes
of the generated image. In the absence of attribute annotations, methods have
to infer which factors are specific to each domain from data during training.
Many state-of-art methods hard-code the desired shared-vs-specific split into
their architecture, severely restricting the scope of the problem. In this
paper, we propose a new method that does not rely on such inductive
architectural biases, and infers which attributes are domain-specific from data
by constraining information flow through the network using translation honesty
losses and a penalty on the capacity of domain-specific embedding. We show that
the proposed method achieves consistently high manipulation accuracy across two
synthetic and one natural dataset spanning a wide variety of domain-specific
and shared attributes.
- Abstract(参考訳): unsupervised image-to-image translation methodは、2つのドメイン間で共有される構造を維持しながら、あるドメインからの画像を別のドメインから妥当な例にマッピングすることを目的としている。
多対多の設定では、生成された画像のドメイン固有の属性を決定するために、対象領域からの追加のガイダンス例が使用される。
属性アノテーションがない場合、メソッドはトレーニング中にデータから各ドメインに固有の要素を推測する必要がある。
多くの最先端のメソッドは、所望の共有vs固有の分割をアーキテクチャにハードコードし、問題のスコープを厳しく制限した。
本稿では,そのような帰納的アーキテクチャバイアスに依存しない新しい手法を提案し,翻訳の正直な損失とドメイン固有の埋め込み能力に対するペナルティを用いて,情報の流れを制約することで,データからどの属性がドメイン固有であるかを推定する。
提案手法は,多種多様なドメイン固有属性と共有属性にまたがる2つの合成データセットと1つの自然データセットにおいて,一貫して高い操作精度を実現する。
関連論文リスト
- WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization [63.98650220772378]
We present WIDIn, Wording Images for Domain-Invariant representation, to disentangleative discriminative visual representation。
まず、ドメイン固有の言語を適応的に識別し、削除するために使用可能な、きめ細かいアライメントを組み込んだ言語を推定する。
WIDInは、CLIPのような事前訓練された視覚言語モデルと、MoCoやBERTのような個別訓練されたユニモーダルモデルの両方に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-05-28T17:46:27Z) - Domain Generalization by Learning and Removing Domain-specific Features [15.061481139046952]
ドメインの一般化は、目に見えないドメインに一般化できるモデルを学ぶことでこの問題に対処することを目的としている。
ドメインの一般化のために、ドメイン固有の機能を明示的に削除することを目的とした、新しいアプローチを提案する。
学習領域固有の特徴を除去した新しい画像空間に各入力画像をマッピングするエンコーダデコーダネットワークを開発した。
論文 参考訳(メタデータ) (2022-12-14T08:46:46Z) - Unsupervised Domain Adaptation for Semantic Segmentation using One-shot
Image-to-Image Translation via Latent Representation Mixing [9.118706387430883]
超高解像度画像のセマンティックセグメンテーションのための新しい教師なし領域適応法を提案する。
潜在コンテンツ表現をドメイン間で混合するエンコーダ・デコーダの原理に基づいて,画像から画像への変換パラダイムを提案する。
都市間比較実験により,提案手法は最先端領域適応法より優れていることが示された。
論文 参考訳(メタデータ) (2022-12-07T18:16:17Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - DRANet: Disentangling Representation and Adaptation Networks for
Unsupervised Cross-Domain Adaptation [23.588766224169493]
dranetは画像表現を分離し、教師なしのクロスドメイン適応のために潜在空間に視覚属性を転送するネットワークアーキテクチャである。
私たちのモデルは、ソースイメージとターゲットイメージの両方からコンテンツ(シーン構造)とスタイル(芸術的外観)の個々の表現をエンコードします。
変換されたスタイルファクタを、各ドメインに指定された学習可能なウェイトと共にコンテンツファクタに組み込むことで、ドメインに適応する。
論文 参考訳(メタデータ) (2021-03-24T18:54:23Z) - SMILE: Semantically-guided Multi-attribute Image and Layout Editing [154.69452301122175]
GAN(Generative Adversarial Networks)の導入以来、属性画像操作は非常に活発な話題となっている。
対象領域の下位領域情報のみを使用しながら、ランダムノイズや画像によって誘導される全ての属性を処理するマルチモーダル表現を提案する。
本手法では,イメージを参照として,あるいはスタイル分布空間を探索することにより,細粒度や粗粒度などの属性の追加,削除,変更を行うことができる。
論文 参考訳(メタデータ) (2020-10-05T20:15:21Z) - Crossing-Domain Generative Adversarial Networks for Unsupervised
Multi-Domain Image-to-Image Translation [12.692904507625036]
複数の領域にまたがる教師なし画像間翻訳のための一般的なフレームワークを提案する。
提案するフレームワークは,一対のエンコーダと一対のGANから構成される。
論文 参考訳(メタデータ) (2020-08-27T01:54:07Z) - Differential Treatment for Stuff and Things: A Simple Unsupervised
Domain Adaptation Method for Semantic Segmentation [105.96860932833759]
最先端のアプローチは、セマンティックレベルのアライメントの実行がドメインシフトの問題に取り組むのに役立つことを証明している。
我々は,物事領域や物事に対する異なる戦略による意味レベルのアライメントを改善することを提案する。
提案手法に加えて,提案手法は,ソースとターゲットドメイン間の最も類似した機能やインスタンス機能を最小化することにより,この問題の緩和に有効であることを示す。
論文 参考訳(メタデータ) (2020-03-18T04:43:25Z) - Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings [76.85673049332428]
画像とテキストの合同表現の学習は、画像キャプションのようないくつかの重要なドメイン横断タスクのバックボーンを形成する。
ドメイン間の共有情報とドメイン固有の情報を個別にモデル化する,新しい半教師付きフレームワークを提案する。
画像キャプションやテキスト・ツー・イメージ合成など,様々なタスクにおけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-02-16T19:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。