Fugu-MT 論文翻訳(概要): Why DDIM Hallucinates More than DDPM: A Theoretical Analysis of Reverse Dynamics

論文の概要: Why DDIM Hallucinates More than DDPM: A Theoretical Analysis of Reverse Dynamics

arxiv url: http://arxiv.org/abs/2605.06831v1
Date: Thu, 07 May 2026 18:34:12 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-11 19:43:38.546415
Title: Why DDIM Hallucinates More than DDPM: A Theoretical Analysis of Reverse Dynamics
Title（参考訳）: DDIMがDDPM以上の幻覚を引き起こす理由:逆ダイナミクスの理論解析
Authors: Muhammad H. Ashiq, Samanyu Arora, Abhinav N. Harish, Ishaan Kharbanda, Hung Yun Tseng, Grigorios G. Chrysos,
Abstract要約: 2つの正準拡散サンプリング装置における幻覚現象について検討する: Denoising Diffusion Probabilistic Model (DDPM) と Denoising Diffusion Implicit Model (DDIM) である。ガウス混合ターゲットの逆ODE (DDIM) とSDE (DDPM) を分析し、臨界時間$$(a) DDIMが2つの最寄りモードを接続するセグメントで立ち往生し、(b) DDPM *stochasticity* がこの領域から不安定になるのを手助けし、幻覚を避ける。
参考スコア（独自算出の注目度）: 5.290519385423529
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We theoretically study the hallucination phenomena in two canonical diffusion samplers: the stochastic Denoising Diffusion Probabilistic Model (DDPM) and the deterministic Denoising Diffusion Implicit Model (DDIM). We analyze the reverse ODE (DDIM) and SDE (DDPM) for a Gaussian mixture target, proving that after a critical time $τ$, (a) DDIM can become stuck on the segment connecting the two nearest modes and (b) DDPM *stochasticity* helps it become unstuck from this region, thus avoiding hallucination. Our empirical validation verifies that DDPM has a significantly lower hallucination rate than DDIM when this region is entered. Building on our observations, we exhibit how using additional stochastic steps can help DDIM avoid hallucinations and offer new insights on how to design improved samplers.
Abstract（参考訳）: 本稿では,2つの標準拡散サンプリング器の幻覚現象について理論的に検討する。ガウス混合ターゲットに対する逆ODE(DDIM)とSDE(DDPM)を解析し、臨界時間(τ$)の後に証明する。 (a)DDIMは、2つの最寄りモードを接続するセグメントに立ち往生することがある。 (b)DDPM *stochasticity*は、この領域から不安定になり、幻覚を避けるのに役立つ。実験による検証では,DDPMは,この領域に入るとDDIMよりも幻覚率が非常に低いことが確認された。本研究は,本研究の成果に基づいて,新たな確率的ステップを用いることで幻覚を回避し,改良型サンプリング器の設計方法に関する新たな知見を提供する。

関連論文リスト

Laplacian Score Sharpening for Mitigating Hallucination in Diffusion Models [4.878587790802629]
本研究では,モードのシャープネスを低減するために,スコアのラプラシアン(あるいは幻覚)を利用する推論中のスコア関数に対するポストホック調整を提案する。この補正により,おもちゃの1D/2D分布と高次元画像データセットをまたいだ幻覚標本の速度が大幅に低下することを示す。
論文参考訳（メタデータ） (2025-11-10T14:16:31Z)
Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data [55.54827581105283]
本研究では, 吸収拡散の具体的なスコアを, クリーンデータの条件付き確率として表すことができることを示す。時間に依存しない条件付き確率を特徴付ける時間条件のない専用拡散モデルを提案する。 5つのゼロショット言語モデルベンチマークにおける拡散モデル間のSOTA性能を実現する。
論文参考訳（メタデータ） (2024-06-06T04:22:11Z)
Fast Diffusion Model [122.36693015093041]
拡散モデル(DM)は、複雑なデータ分布を捉える能力を持つ様々な分野に採用されている。本稿では,DM最適化の観点から,高速拡散モデル (FDM) を提案する。
論文参考訳（メタデータ） (2023-06-12T09:38:04Z)
Reconstructing Graph Diffusion History from a Single Snapshot [87.20550495678907]
A single SnapsHot (DASH) から拡散履歴を再構築するための新しいバリセンターの定式化を提案する。本研究では,拡散パラメータ推定のNP硬度により,拡散パラメータの推定誤差が避けられないことを証明する。また、DITTO(Diffusion hitting Times with Optimal proposal)という効果的な解法も開発している。
論文参考訳（メタデータ） (2023-06-01T09:39:32Z)
Alleviating Exposure Bias in Diffusion Models through Sampling with Shifted Time Steps [23.144083737873263]
拡散確率モデル (DPM) は高品質な画像の合成において顕著な有効性を示した。これまでの研究は、トレーニング中に入力を摂動することでこの問題を緩和しようと試みてきた。モデルを再学習することなく,提案する新しいサンプリング手法を提案する。
論文参考訳（メタデータ） (2023-05-24T21:39:27Z)
DisDiff: Unsupervised Disentanglement of Diffusion Probabilistic Models [42.58375679841317]
拡散確率モデル(DPM)の解離という新たな課題を提案する。この課題は、観測の背後にある固有の因子を自動的に発見し、DPMの勾配場を下位段階の磁場に分解することである。そこで我々は,DPMの枠組みにおいて,不整合表現学習を実現するために,DisDiffという教師なしのアプローチを考案した。
論文参考訳（メタデータ） (2023-01-31T15:58:32Z)
gDDIM: Generalized denoising diffusion implicit models [15.877673959068455]
拡散暗黙モデル(DDIM)を等方的拡散に加えて一般拡散モデル(DM)に拡張する。我々は2つの非等方性DMにおいて20倍以上の加速を観測した。 CIFAR10のFIDスコアは2.26で,NFEは50点,NFEは27点,FIDスコアは2.86点であった。
論文参考訳（メタデータ） (2022-06-11T16:57:23Z)
Pseudo Numerical Methods for Diffusion Models on Manifolds [77.40343577960712]
Denoising Diffusion Probabilistic Models (DDPM) は、画像やオーディオサンプルなどの高品質なサンプルを生成することができる。 DDPMは最終的なサンプルを生成するために数百から数千のイテレーションを必要とする。拡散モデル(PNDM)の擬似数値法を提案する。 PNDMは、1000段DDIM(20倍の高速化)と比較して、50段の精度で高品質な合成画像を生成することができる
論文参考訳（メタデータ） (2022-02-20T10:37:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。