Fugu-MT 論文翻訳(概要): Mitigating Exposure Bias in Discriminator Guided Diffusion Models

論文の概要: Mitigating Exposure Bias in Discriminator Guided Diffusion Models

arxiv url: http://arxiv.org/abs/2311.11164v1
Date: Sat, 18 Nov 2023 20:49:50 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-22 10:21:16.969481
Title: Mitigating Exposure Bias in Discriminator Guided Diffusion Models
Title（参考訳）: 判別器誘導拡散モデルにおける露出バイアスの軽減
Authors: Eleftherios Tsonis, Paraskevi Tzouveli, Athanasios Voulodimos
Abstract要約: 本稿では,識別器誘導とエプシロンスケーリングを組み合わせたSEDM-G++を提案する。提案手法は,非条件CIFAR-10データセット上でFIDスコア1.73を達成し,現状よりも優れている。
参考スコア（独自算出の注目度）: 4.5349436061325425
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion Models have demonstrated remarkable performance in image generation. However, their demanding computational requirements for training have prompted ongoing efforts to enhance the quality of generated images through modifications in the sampling process. A recent approach, known as Discriminator Guidance, seeks to bridge the gap between the model score and the data score by incorporating an auxiliary term, derived from a discriminator network. We show that despite significantly improving sample quality, this technique has not resolved the persistent issue of Exposure Bias and we propose SEDM-G++, which incorporates a modified sampling approach, combining Discriminator Guidance and Epsilon Scaling. Our proposed approach outperforms the current state-of-the-art, by achieving an FID score of 1.73 on the unconditional CIFAR-10 dataset.
Abstract（参考訳）: 拡散モデルは画像生成において顕著な性能を示した。しかし, 学習に必要な計算条件が要求されるため, サンプリングプロセスの修正によって生成画像の品質を高める努力が続けられている。最近のアプローチである判別器ガイダンス(discriminator guidance)は、識別器ネットワークから派生した補助用語を組み込むことで、モデルスコアとデータスコアとのギャップを埋めることを目指している。本手法は,試料品質を著しく改善したものの,露光バイアスの持続的な問題を解決していないことを示し,判別器指導とエプシロンスケーリングを組み合わせた改良サンプリング手法を組み込んだsemm-g++を提案する。提案手法は,非条件CIFAR-10データセット上でFIDスコア1.73を達成し,現状よりも優れている。

関連論文リスト

Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文参考訳（メタデータ） (2025-10-03T14:00:32Z)
Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2025-06-03T09:29:47Z)
Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering [18.543769006014383]
拡散モデルはしばしば、サンプリング軌跡に固有の変化のために、一貫性のないサンプル品質を示す。 CFG-リジェクション(CFG-Rejection)は,デノナイジングプロセスの初期段階において,低品質なサンプルをフィルタリングする効率的なプラグアンドプレイ戦略である。画像生成におけるCFG-Rejectionの有効性を広範囲な実験により検証する。
論文参考訳（メタデータ） (2025-05-29T11:08:24Z)
DIVE: Inverting Conditional Diffusion Models for Discriminative Tasks [79.50756148780928]
本稿では,事前学習した拡散モデルを用いて識別課題を遂行する問題について検討する。我々は、事前学習されたレイアウト・ツー・イメージ拡散モデルの「反転」により、事前学習した凍結生成拡散モデルの識別能力を分類タスクからより複雑なオブジェクト検出タスクに拡張する。
論文参考訳（メタデータ） (2025-04-24T05:13:27Z)
Diffusion Model Guided Sampling with Pixel-Wise Aleatoric Uncertainty Estimation [10.269485943949332]
本稿では,拡散モデルのサンプリングフェーズにおける画素単位のアレタリック不確かさを推定する。この不確実性は、拡散モデルに特化して設計された摂動スキームによるデノナイジングスコアのばらつきとして計算される。 FIDスコアの点から,本手法がより優れたサンプル生成に繋がることを示す。
論文参考訳（メタデータ） (2024-11-29T19:02:08Z)
Informed Correctors for Discrete Diffusion Models [31.814439169033616]
本稿では, 近似誤差をより確実に対応させるために, 拡散モデルにより補正器が通知される予測器・補正器サンプリング方式を提案する。トークン化された ImageNet 256x256 において、この手法はより少ないステップで優れたサンプルを生成し、離散拡散モデルのFIDスコアを改良した。
論文参考訳（メタデータ） (2024-07-30T23:29:29Z)
Bayesian Conditioned Diffusion Models for Inverse Problems [11.67269909384503]
拡散モデルは、前方測定演算子に基づく逆問題を含む多くの画像再構成タスクにおいて優れている。本稿では,所望の画像の条件分布に関連付けられたスコア関数に基づく拡散モデルBCDMのための新しいベイズ条件付け手法を提案する。提案手法を用いて,画像処理,デブロアリング,超高解像度化,及びインペイントにおける最先端性能を示す。
論文参考訳（メタデータ） (2024-06-14T07:13:03Z)
Compensation Sampling for Improved Convergence in Diffusion Models [12.311434647047427]
拡散モデルは画像生成において顕著な品質を達成するが、コストはかかる。反復 denoising は高忠実度画像を生成するために多くの時間ステップを必要とする。対象データの初期的不正確な再構成による復元誤差の蓄積により,復調過程が著しく制限されていることを論じる。
論文参考訳（メタデータ） (2023-12-11T10:39:01Z)
Diffusion-TTA: Test-time Adaptation of Discriminative Models via Generative Feedback [97.0874638345205]
生成モデルは、識別モデルのための優れたテストタイムアダプタになり得る。提案手法であるDiffusion-TTAは,事前学習した判別モデルを,テストセットの各未学習例に適応させる。拡散-TTAは,様々な大規模事前学習型判別モデルの精度を著しく向上させることを示した。
論文参考訳（メタデータ） (2023-11-27T18:59:53Z)
CADS: Unleashing the Diversity of Diffusion Models through Condition-Annealed Sampling [27.795088366122297]
Condition-Annealed Diffusion Sampler (CADS) は任意の事前学習モデルとサンプリングアルゴリズムで使用することができる。本研究では,様々な条件生成タスクにおける拡散モデルの多様性を向上することを示す。
論文参考訳（メタデータ） (2023-10-26T12:27:56Z)
Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文参考訳（メタデータ） (2023-08-28T08:47:06Z)
Insights into Closed-form IPM-GAN Discriminator Guidance for Diffusion Modeling [11.68361062474064]
本稿では,GAN判別器がLangevinに基づくサンプリングに与える影響を理論的に解析する枠組みを提案する。提案手法は既存の加速拡散技術と組み合わせて潜在空間画像生成を改善することができることを示す。
論文参考訳（メタデータ） (2023-06-02T16:24:07Z)
DuDGAN: Improving Class-Conditional GANs via Dual-Diffusion [2.458437232470188]
GAN(Generative Adversarial Network)を用いたクラス条件画像生成について,様々な手法を用いて検討した。本稿では,DuDGANと呼ばれる2次元拡散型ノイズ注入法を取り入れたGANを用いたクラス条件画像生成手法を提案する。提案手法は,画像生成のための現状条件付きGANモデルよりも性能的に優れている。
論文参考訳（メタデータ） (2023-05-24T07:59:44Z)
Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T15:32:59Z)
Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文参考訳（メタデータ） (2023-04-10T17:54:38Z)
Diffusion Denoising Process for Perceptron Bias in Out-of-distribution Detection [67.49587673594276]
我々は、識別器モデルが入力の特定の特徴に対してより敏感であることを示唆する新しいパーセプトロンバイアスの仮定を導入し、過度な問題を引き起こした。 DMの拡散分解過程 (DDP) が非対称の新たな形態として機能し, 入力を高め, 過信問題を緩和するのに適していることを示す。 CIFAR10, CIFAR100, ImageNetによる実験により, 提案手法がSOTA手法より優れていることが示された。
論文参考訳（メタデータ） (2022-11-21T08:45:08Z)
Uncertainty-aware Generalized Adaptive CycleGAN [44.34422859532988]
unpaired image-to-image translationは、教師なしの方法で画像ドメイン間のマッピングを学ぶことを指す。既存の手法はしばしば、外れ値への堅牢性や予測不確実性を明示的にモデル化せずに決定論的マッピングを学習する。 Uncertainty-aware Generalized Adaptive Cycle Consistency (UGAC) という新しい確率論的手法を提案する。
論文参考訳（メタデータ） (2021-02-23T15:22:35Z)
When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文参考訳（メタデータ） (2020-02-24T11:35:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。