論文の概要: When Are Two Scores Better Than One? Investigating Ensembles of Diffusion Models
- arxiv url: http://arxiv.org/abs/2601.11444v1
- Date: Fri, 16 Jan 2026 17:07:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.578177
- Title: When Are Two Scores Better Than One? Investigating Ensembles of Diffusion Models
- Title(参考訳): 2つのスコアが1より良いのはいつか? 拡散モデルのアンサンブルを探る
- Authors: Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso, Damien Garreau, Pierre-Alexandre Mattei,
- Abstract要約: スコアのアンサンブルは、一般的にスコアマッチング損失とモデル可能性を改善するが、画像データセット上のFIDのような知覚品質指標を一貫して強化することができない。
また,楽譜モデルの要約に関する理論的知見も提供し,アンサンブルだけでなく,いくつかのモデル構成技術にも光を当てた。
- 参考スコア(独自算出の注目度): 22.019987128734282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models now generate high-quality, diverse samples, with an increasing focus on more powerful models. Although ensembling is a well-known way to improve supervised models, its application to unconditional score-based diffusion models remains largely unexplored. In this work we investigate whether it provides tangible benefits for generative modelling. We find that while ensembling the scores generally improves the score-matching loss and model likelihood, it fails to consistently enhance perceptual quality metrics such as FID on image datasets. We confirm this observation across a breadth of aggregation rules using Deep Ensembles, Monte Carlo Dropout, on CIFAR-10 and FFHQ. We attempt to explain this discrepancy by investigating possible explanations, such as the link between score estimation and image quality. We also look into tabular data through random forests, and find that one aggregation strategy outperforms the others. Finally, we provide theoretical insights into the summing of score models, which shed light not only on ensembling but also on several model composition techniques (e.g. guidance).
- Abstract(参考訳): 拡散モデルは高品質で多様なサンプルを生成し、より強力なモデルにフォーカスしている。
アンサンブルは教師付きモデルを改善するためのよく知られた方法であるが、無条件のスコアベース拡散モデルへの応用はほとんど未解明のままである。
本研究は, 生成モデルに有意な利点をもたらすかどうかを考察する。
スコアのアンサンブルは、一般的にスコアマッチング損失とモデル可能性を改善するが、画像データセット上のFIDのような知覚品質指標を一貫して強化することができない。
我々は,CIFAR-10およびFFHQ上でのDeep Ensembles, Monte Carlo Dropoutを用いて,この観測を広範囲にわたるアグリゲーションルールで確認した。
本研究は,スコア推定と画像品質の関連性など,可能な説明を探索することによって,この相違を説明しようとするものである。
また、ランダムな森林を通した表形式のデータを調べ、一つの集約戦略が他よりも優れていることを確かめる。
最後に,楽譜モデルの要約に関する理論的知見を提示し,アンサンブルだけでなく,複数のモデル構成技術(例えば指導法)にも光を当てた。
関連論文リスト
- Score Augmentation for Diffusion Models [36.66701387426494]
拡散モデルに特化して設計された新しいデータ拡張フレームワークであるScore Augmentation(ScoreAug)を提案する。
ScoreAugはノイズの多いデータに変換を適用する。
実験では、CIFAR-10、FFHQ、AFHQv2、ImageNetなどの複数のベンチマークでScoreAugを広範囲に検証した。
論文 参考訳(メタデータ) (2025-08-11T12:39:46Z) - Zero-Shot Image Anomaly Detection Using Generative Foundation Models [2.241618130319058]
本研究は,意味的異常検出のための基礎的ツールとしてスコアベース生成モデルの利用について検討する。
スタインスコアの誤差を解析することにより,各ターゲットデータセットの再学習を必要とせず,異常サンプルを識別する新しい手法を提案する。
このアプローチは最先端よりも改善され、ひとつのデータセット — CelebA -- 上で単一のモデルをトレーニングすることに依存しています。
論文 参考訳(メタデータ) (2025-07-30T13:56:36Z) - Multi-Level Collaboration in Model Merging [56.31088116526825]
本稿では,モデルマージとモデルアンサンブルの本質的な関係について考察する。
これまでの制限が満たされていない場合でも、モデルのマージによって、アンサンブルと同じような、ほぼ同一かつ優れたパフォーマンスを達成する方法がまだ存在することが分かっています。
論文 参考訳(メタデータ) (2025-03-03T07:45:04Z) - Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution [67.9215891673174]
離散空間に対するスコアマッチングを自然に拡張する新たな損失として,スコアエントロピーを提案する。
標準言語モデリングタスク上で,Score Entropy Discrete Diffusionモデルをテストする。
論文 参考訳(メタデータ) (2023-10-25T17:59:12Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - Score-Based Generative Classifiers [9.063815952852783]
生成モデルは、MNISTのような単純なデータセット上で逆向きに堅牢な分類器として使われてきた。
これまでの結果は、データの可能性と分類精度のトレードオフを示唆している。
スコアに基づく生成モデルは,標準的な識別モデルと比較して,分類精度のギャップを埋めていることを示す。
論文 参考訳(メタデータ) (2021-10-01T15:05:33Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。