論文の概要: One-shot Unsupervised Domain Adaptation with Personalized Diffusion
Models
- arxiv url: http://arxiv.org/abs/2303.18080v2
- Date: Fri, 16 Jun 2023 16:27:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 17:36:43.140389
- Title: One-shot Unsupervised Domain Adaptation with Personalized Diffusion
Models
- Title(参考訳): 個人化拡散モデルを用いたワンショット非教師付きドメイン適応
- Authors: Yasser Benigmim, Subhankar Roy, Slim Essid, Vicky Kalogeiton,
St\'ephane Lathuili\`ere
- Abstract要約: ラベル付きソースドメインからターゲットドメインへのセグメンテーションモデルの適用は、ドメイン適応において最も難しい問題の1つである。
テキストと画像の拡散モデルを用いて、写真リアル画像を用いた合成ターゲットデータセットを生成する。
実験の結果,本手法は最先端OSUDA法を最大7.1%超えることがわかった。
- 参考スコア(独自算出の注目度): 15.590759602379517
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting a segmentation model from a labeled source domain to a target
domain, where a single unlabeled datum is available, is one the most
challenging problems in domain adaptation and is otherwise known as one-shot
unsupervised domain adaptation (OSUDA). Most of the prior works have addressed
the problem by relying on style transfer techniques, where the source images
are stylized to have the appearance of the target domain. Departing from the
common notion of transferring only the target ``texture'' information, we
leverage text-to-image diffusion models (e.g., Stable Diffusion) to generate a
synthetic target dataset with photo-realistic images that not only faithfully
depict the style of the target domain, but are also characterized by novel
scenes in diverse contexts. The text interface in our method Data AugmenTation
with diffUsion Models (DATUM) endows us with the possibility of guiding the
generation of images towards desired semantic concepts while respecting the
original spatial context of a single training image, which is not possible in
existing OSUDA methods. Extensive experiments on standard benchmarks show that
our DATUM surpasses the state-of-the-art OSUDA methods by up to +7.1%. The
implementation is available at https://github.com/yasserben/DATUM
- Abstract(参考訳): ラベル付きソースドメインからターゲットドメインへのセグメンテーションモデルの適用は、単一のラベルなしのdatumが利用可能な場合、ドメイン適応において最も難しい問題のひとつであり、その他はone-shot unsupervised domain adaptation(osuda)として知られている。
以前の作品の多くは、ソースイメージがターゲットドメインの外観を持つようにスタイル化されているスタイル転送技術に頼ってこの問題に対処してきた。
対象の『texture』情報のみを転送するという一般的な概念とは別に、テキストと画像の拡散モデル(例えば、安定拡散)を利用して、対象のドメインのスタイルを忠実に描写するだけでなく、多様な文脈における斬新なシーンによって特徴付けられる写真リアル画像の合成ターゲットデータセットを生成する。
本手法のテキストインタフェースは,DATUM (Data AugmenTation with diffusion Models) により,既存のOSUDA法では不可能な,単一のトレーニング画像の空間的コンテキストを尊重しながら,所望のセマンティック概念に向けて画像の生成を導くことができる。
標準ベンチマークでの大規模な実験により、我々のDATUMは最先端のOSUDAメソッドを最大で7.1%超えた。
実装はhttps://github.com/yasserben/DATUMで公開されている。
関連論文リスト
- Phrase Grounding-based Style Transfer for Single-Domain Generalized
Object Detection [109.58348694132091]
単一ドメインの一般化オブジェクト検出は、複数の未確認対象ドメインに対するモデルの一般化性を高めることを目的としている。
これは、ターゲットのドメインデータをトレーニングに組み込むことなく、ドメインシフトに対処するモデルを必要とするため、実用的だが難しいタスクである。
そこで我々は,課題に対する新しい文節接頭辞に基づくスタイル伝達手法を提案する。
論文 参考訳(メタデータ) (2024-02-02T10:48:43Z) - Adapt Anything: Tailor Any Image Classifiers across Domains And
Categories Using Text-to-Image Diffusion Models [82.95591765009105]
我々は,現代テキスト・画像拡散モデルが,ドメインやカテゴリ間でタスク適応型画像分類器をカスタマイズできるかどうかを検討することを目的とする。
対象のテキストプロンプトから派生したカテゴリラベルを用いた画像合成には,1つのオフ・ザ・シェルフテキスト・ツー・イメージモデルのみを用いる。
論文 参考訳(メタデータ) (2023-10-25T11:58:14Z) - Transcending Domains through Text-to-Image Diffusion: A Source-Free
Approach to Domain Adaptation [6.649910168731417]
ドメイン適応(ドメイン適応、Domain Adaptation、DA)は、アノテートデータが不十分なターゲットドメインにおけるモデルの性能を高める方法である。
本研究では,対象領域のサンプルに基づいてトレーニングしたテキスト・ツー・イメージ拡散モデルを用いて,ソースデータを生成する新しいSFDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-02T23:38:17Z) - Spectral Adversarial MixUp for Few-Shot Unsupervised Domain Adaptation [72.70876977882882]
臨床応用においては、トレーニング画像(ソース領域)とテスト画像(ターゲット領域)が異なる分布下にある場合、ドメインシフトは一般的な問題である。
本稿では,Few-Shot Unsupervised Domain Adaptation (FSUDA) の新たな手法を提案する。
論文 参考訳(メタデータ) (2023-09-03T16:02:01Z) - Improving Diversity in Zero-Shot GAN Adaptation with Semantic Variations [61.132408427908175]
0ショットのGAN適応は、よく訓練されたジェネレータを再利用して、目に見えないターゲットドメインの画像を合成することを目的としている。
実際の画像の代わりに1つの代表的テキスト機能しか持たないため、合成された画像は徐々に多様性を損なう。
そこで本研究では,CLIP空間における対象テキストの意味的変化を見つけるための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T08:12:28Z) - Instance-level Heterogeneous Domain Adaptation for Limited-labeled
Sketch-to-Photo Retrieval [36.32367182571164]
インスタンスレベルの不均一ドメイン適応(IHDA)フレームワークを提案する。
我々は,インスタンスレベルの知識を帰納的伝達方式で伝達することを目的とした,アイデンティティラベル学習のための微調整戦略を適用した。
提案手法は,3つのスケッチ・ツー・フォト画像検索ベンチマークに対して,アノテーションを伴わずに新たな手法を設定できることが実験により示されている。
論文 参考訳(メタデータ) (2022-11-26T08:50:08Z) - Continual Unsupervised Domain Adaptation for Semantic Segmentation using
a Class-Specific Transfer [9.46677024179954]
セグメンテーションモデルは 目に見えない領域に一般化しません
2つのクラス条件のAdaIN層を組み込んだ軽量なスタイル転送フレームワークを提案する。
合成シーケンスに対する我々のアプローチを広く検証し、さらに実領域からなる挑戦的なシーケンスを提案する。
論文 参考訳(メタデータ) (2022-08-12T21:30:49Z) - Source-Free Domain Adaptive Fundus Image Segmentation with Denoised
Pseudo-Labeling [56.98020855107174]
ドメイン適応は通常、ソースドメインデータにアクセスして、ターゲットデータとのドメインアライメントのために配布情報を利用する必要があります。
多くの実世界のシナリオでは、プライバシの問題により、ターゲットドメインのモデル適応中にソースデータがアクセスできない場合がある。
本稿では,本問題に対する新たな擬似ラベル付け手法を提案する。
論文 参考訳(メタデータ) (2021-09-19T06:38:21Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Consistency Regularization with High-dimensional Non-adversarial
Source-guided Perturbation for Unsupervised Domain Adaptation in Segmentation [15.428323201750144]
BiSIDAは、未ラベルのターゲットデータセットからの情報を効率的に活用するために、一貫性の正則化を採用している。
BiSIDAは、一般的に使われている2つの合成-実領域適応ベンチマーク上で、新しい最先端を実現する。
論文 参考訳(メタデータ) (2020-09-18T03:26:44Z) - Source Free Domain Adaptation with Image Translation [33.46614159616359]
大規模なデータセットをリリースする努力は、プライバシと知的財産権の考慮によって損なわれる可能性がある。
実現可能な代替手段は、代わりに事前訓練されたモデルをリリースすることである。
本稿では,対象画像のスタイルを未知のソース画像に変換する画像翻訳手法を提案する。
論文 参考訳(メタデータ) (2020-08-17T17:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。