論文の概要: Few-shot Image Generation with Diffusion Models
- arxiv url: http://arxiv.org/abs/2211.03264v1
- Date: Mon, 7 Nov 2022 02:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:31:51.230466
- Title: Few-shot Image Generation with Diffusion Models
- Title(参考訳): 拡散モデルによる少数ショット画像生成
- Authors: Jingyuan Zhu, Huimin Ma, Jiansheng Chen, Jian Yuan
- Abstract要約: 拡散確率モデル(DDPM)は、大量のデータに基づいて訓練された際に、顕著な多様性で高品質な画像を合成できることが証明されている。
現代のアプローチは、主にGAN(Generative Adversarial Networks)とAdapted Model(Adapted Model)に基づいて構築されている。
本稿では, DDPMが過度に適合し, トレーニングデータが不足するにつれて, 高度に多様性が低下する事例について検討する。
- 参考スコア(独自算出の注目度): 18.532357455856836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Denoising diffusion probabilistic models (DDPMs) have been proven capable of
synthesizing high-quality images with remarkable diversity when trained on
large amounts of data. However, to our knowledge, few-shot image generation
tasks have yet to be studied with DDPM-based approaches. Modern approaches are
mainly built on Generative Adversarial Networks (GANs) and adapt models
pre-trained on large source domains to target domains using a few available
samples. In this paper, we make the first attempt to study when do DDPMs
overfit and suffer severe diversity degradation as training data become scarce.
Then we propose to adapt DDPMs pre-trained on large source domains to target
domains using limited data. Our results show that utilizing knowledge from
pre-trained DDPMs can significantly accelerate convergence and improve the
quality and diversity of the generated images. Moreover, we propose a
DDPM-based pairwise similarity loss to preserve the relative distances between
generated samples during domain adaptation. In this way, we further improve the
generation diversity of the proposed DDPM-based approaches. We demonstrate the
effectiveness of our approaches qualitatively and quantitatively on a series of
few-shot image generation tasks and achieve results better than current
state-of-the-art GAN-based approaches in quality and diversity.
- Abstract(参考訳): denoising diffusion probabilistic models (ddpms) は、大量のデータでトレーニングされた場合、非常に多様な高品質な画像を合成できることが証明されている。
しかし、我々の知る限り、DDPMベースのアプローチではほとんど画像生成タスクは研究されていない。
現代のアプローチは、主にgan(generative adversarial network)に基づいて構築され、利用可能なサンプルを使用して、大きなソースドメインで事前トレーニングされたモデルをターゲットドメインに適応させる。
本稿では,ddpmsが過度に適合し,訓練データ不足により多様性が低下する状況について,初めて検討する。
次に,大規模ソースドメインで事前学習されたddpmを,限られたデータを用いてターゲットドメインに適用することを提案する。
その結果,事前学習したDDPMの知識を利用することで,コンバージェンスを著しく加速し,生成画像の品質と多様性を向上させることができることがわかった。
さらに,ドメイン適応中に生成されたサンプル間の相対的な距離を保存するため,DDPMに基づくペアワイズ類似度損失を提案する。
このようにして,提案するddpmに基づく手法の多様性をさらに向上させる。
本研究は, 画像生成タスクの質的, 定量的に評価し, 品質と多様性における現状のGANベースのアプローチよりも優れた結果が得られることを示す。
関連論文リスト
- Diffuse-UDA: Addressing Unsupervised Domain Adaptation in Medical Image Segmentation with Appearance and Structure Aligned Diffusion Models [31.006056670998852]
3次元医用画像におけるvoxelレベルのアノテーションの欠如と複雑さは重要な課題である。
この格差は、医療における人工知能アルゴリズムの公平性に影響を与える。
医用画像セグメンテーションにおけるUnsupervised Domain Adaptation(UDA)に取り組むために拡散モデルを利用した新しい手法であるDiffuse-UDAを紹介する。
論文 参考訳(メタデータ) (2024-08-12T08:21:04Z) - SAR Image Synthesis with Diffusion Models [0.0]
拡散モデル(DM)は、合成データを生成する一般的な方法となっている。
本研究では,拡散確率モデル (DDPM) をSAR領域に適応させる特定の種類のDMについて述べる。
DDPMは,SAR画像生成のための最先端のGAN法よりも質的に,定量的に優れていることを示す。
論文 参考訳(メタデータ) (2024-05-13T14:21:18Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - On Inference Stability for Diffusion Models [6.846175045133414]
DPM(Denoising Probabilistic Models)は、多彩で高品質な画像を生成するのに優れた生成モデルの分野である。
現在のDPMのトレーニング手法の多くは、時間ステップ間の相関を無視することが多く、画像生成におけるモデルの性能を効果的に制限している。
そこで本研究では,サンプリング品質を高めるために,推定ギャップを小さくすることを目的とした,新しいtextVinitsequence-aware Losを提案する。
論文 参考訳(メタデータ) (2023-12-19T18:57:34Z) - Subject-Based Domain Adaptation for Facial Expression Recognition [51.10374151948157]
ディープラーニングモデルを特定の対象個人に適用することは、難しい表情認識タスクである。
本稿では、FERにおける主観的ドメイン適応のための新しいMSDA手法を提案する。
複数の情報源からの情報を効率的に利用して、ディープFERモデルを単一のターゲット個人に適応させる。
論文 参考訳(メタデータ) (2023-12-09T18:40:37Z) - Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [64.95663299945171]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。
EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。
本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文 参考訳(メタデータ) (2023-09-10T22:05:24Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Efficient Transfer Learning in Diffusion Models via Adversarial Noise [21.609168219488982]
拡散確率モデル (DPM) は画像生成タスクにおいて大きな可能性を証明している。
GANのような以前の研究は、十分なデータで学習したトレーニング済みモデルを転送することで、限られたデータ問題に対処してきた。
限られたデータ問題に対処するために,新しいDPMに基づくトランスファー学習手法であるTANを提案する。
論文 参考訳(メタデータ) (2023-08-23T06:44:44Z) - DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image
Generation using Limited Data [20.998032566820907]
本稿では,大規模ソースデータセット上で事前学習したDDPMを限定データを用いて対象ドメインに適応する新しいDomainStudioアプローチを提案する。
ソースドメインが提供する主題の多様性を維持し、ターゲットドメインに高品質で多様な適応型サンプルを取得するように設計されている。
論文 参考訳(メタデータ) (2023-06-25T07:40:39Z) - Source-free Domain Adaptation Requires Penalized Diversity [60.04618512479438]
ソースデータがない場合、異なるドメイン間の知識伝達に対処するために、ソースフリードメイン適応(SFDA)が導入された。
教師なしのFDAでは、多様性はソース上の1つの仮説を学習するか、共有された特徴抽出器で複数の仮説を学習することに限定される。
本稿では,異なる特徴抽出器を用いて表現多様性を促進する新しい無教師付きSFDAアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-06T00:20:19Z) - Making Substitute Models More Bayesian Can Enhance Transferability of
Adversarial Examples [89.85593878754571]
ディープニューラルネットワークにおける敵の例の転送可能性は多くのブラックボックス攻撃の欠如である。
我々は、望ましい転送可能性を達成するためにベイズモデルを攻撃することを提唱する。
我々の手法は近年の最先端を大きなマージンで上回る。
論文 参考訳(メタデータ) (2023-02-10T07:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。