論文の概要: RODS: Robust Optimization Inspired Diffusion Sampling for Detecting and Reducing Hallucination in Generative Models
- arxiv url: http://arxiv.org/abs/2507.12201v1
- Date: Wed, 16 Jul 2025 12:55:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.394426
- Title: RODS: Robust Optimization Inspired Diffusion Sampling for Detecting and Reducing Hallucination in Generative Models
- Title(参考訳): RODS: 生成モデルにおける幻覚の検出と低減のためのロバスト最適化による拡散サンプリング
- Authors: Yiqi Tian, Pengfei Jin, Mingze Yuan, Na Li, Bo Zeng, Quanzheng Li,
- Abstract要約: RODSは、損失景観からの幾何学的手がかりを用いて、リスクの高いサンプリングステップを検出し、修正する新しい手法である。
RODSはよりスムーズなサンプリング軌道を強制し、摂動を適応的に調整し、再訓練せずに幻覚を減少させ、最小限の推論コストで追加する。
- 参考スコア(独自算出の注目度): 12.977265158883977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have achieved state-of-the-art performance in generative modeling, yet their sampling procedures remain vulnerable to hallucinations, often stemming from inaccuracies in score approximation. In this work, we reinterpret diffusion sampling through the lens of optimization and introduce RODS (Robust Optimization-inspired Diffusion Sampler), a novel method that detects and corrects high-risk sampling steps using geometric cues from the loss landscape. RODS enforces smoother sampling trajectories and adaptively adjusts perturbations, reducing hallucinations without retraining and at minimal additional inference cost. Experiments on AFHQv2, FFHQ, and 11k-hands demonstrate that RODS improves both sampling fidelity and robustness, detecting over 70% of hallucinated samples and correcting more than 25%, all while avoiding the introduction of new artifacts.
- Abstract(参考訳): 拡散モデルは、生成モデルにおいて最先端のパフォーマンスを達成したが、それらのサンプリング手順は、しばしばスコア近似の不正確さから生じる幻覚に弱いままである。
本研究では,最適化レンズによる拡散サンプリングを再解釈し,ロスランドスケープから幾何的手がかりを用いて高リスクサンプリングステップを検出し,修正するRODS(Robust Optimization-inspired Diffusion Sampler)を導入する。
RODSはよりスムーズなサンプリング軌道を強制し、摂動を適応的に調整し、再訓練せずに幻覚を減少させ、最小限の推論コストで追加する。
AFHQv2、FFHQ、11kハンドの実験では、RODSはサンプリングの忠実度と堅牢性の両方を改善し、幻覚標本の70%以上を検出し、25%以上を補正し、新しいアーティファクトの導入を避けている。
関連論文リスト
- PWD: Prior-Guided and Wavelet-Enhanced Diffusion Model for Limited-Angle CT [6.532073662427578]
LACT再構成のための先行情報埋め込みとウェーブレット特徴融合高速サンプリング拡散モデルを提案する。
PWDは、LACTの再構成忠実性を保ちながら効率的なサンプリングを可能にする。
PWDは50ステップしかサンプリングしないため、PSNRの少なくとも1.7dB改善とSSIMの10%向上を実現している。
論文 参考訳(メタデータ) (2025-06-30T08:28:32Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - Adaptive Destruction Processes for Diffusion Samplers [12.446080077998834]
本稿では,拡散サンプリング装置におけるトレーニング可能な破壊プロセスの課題とメリットについて考察する。
ステップ数に制限がある場合、生成過程と破壊過程の両方を訓練することで、より高速な収束とサンプリング品質の向上が期待できる。
論文 参考訳(メタデータ) (2025-06-02T11:07:27Z) - Inference-Time Diffusion Model Distillation [59.350789627086456]
本稿では,新しい推論時間蒸留フレームワークであるDistillation++を紹介する。
条件付きサンプリングの最近の進歩に触発されて,本手法は学生モデルサンプリングを近位最適化問題として再放送する。
逆サンプリング中の蒸留最適化を統合し,教師指導とみなすことができる。
論文 参考訳(メタデータ) (2024-12-12T02:07:17Z) - Diffusion Rejection Sampling [13.945372555871414]
Diffusion Rejection Sampling (DiffRS) は、サンプリングされたトランジションカーネルを各タイムステップで真のカーネルと整列するリジェクションサンプリングスキームである。
提案手法は, 各中間段階における試料の品質を評価し, 試料に応じて異なる作業で精製する機構とみなすことができる。
実験により,ベンチマークデータセット上でのDiffRSの最先端性能と高速拡散サンプリングおよび大規模テキスト・画像拡散モデルに対するDiffRSの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-28T07:00:28Z) - Towards Fast Stochastic Sampling in Diffusion Generative Models [22.01769257075573]
拡散モデルは、推論時に遅いサンプル生成に悩まされる。
拡張空間における事前学習拡散モデルにおける高速サンプリングのための分割法を提案する。
本研究では,スプリッティングの単純適用が高速サンプリングに最適であることを示す。
論文 参考訳(メタデータ) (2024-02-11T14:04:13Z) - SMRD: SURE-based Robust MRI Reconstruction with Diffusion Models [76.43625653814911]
拡散モデルは、高い試料品質のため、MRIの再生を加速するために人気を博している。
推論時に柔軟にフォワードモデルを組み込んだまま、効果的にリッチなデータプリエントとして機能することができる。
拡散モデル(SMRD)を用いたSUREに基づくMRI再構成を導入し,テスト時の堅牢性を向上する。
論文 参考訳(メタデータ) (2023-10-03T05:05:35Z) - Optimizing Sampling Patterns for Compressed Sensing MRI with Diffusion
Generative Models [75.52575380824051]
圧縮センシングマルチコイルMRIにおけるサブサンプリングパターンを最適化する学習手法を提案する。
拡散モデルとMRI計測プロセスにより得られた後部平均推定値に基づいて1段階の再構成を行う。
本手法では,効果的なサンプリングパターンの学習には5つのトレーニング画像が必要である。
論文 参考訳(メタデータ) (2023-06-05T22:09:06Z) - Solving Diffusion ODEs with Optimal Boundary Conditions for Better Image Super-Resolution [82.50210340928173]
拡散モデルのランダム性は非効率性と不安定性をもたらすため、SR結果の品質を保証することは困難である。
本稿では,一連の拡散型SR手法の恩恵を受ける可能性を持つプラグアンドプレイサンプリング手法を提案する。
提案手法によりサンプリングされたSR結果の質は, 学習前の拡散ベースSRモデルと同一のランダム性を有する現在の手法でサンプリングされた結果の質より優れる。
論文 参考訳(メタデータ) (2023-05-24T17:09:54Z) - ReSmooth: Detecting and Utilizing OOD Samples when Training with Data
Augmentation [57.38418881020046]
最近のDA技術は、常に強化トレーニングサンプルの多様性の必要性を満たす。
多様性の高い増分戦略は、通常、アウト・オブ・ディストリビューション(OOD)の増分サンプルを導入する。
ReSmoothは、まず、拡張サンプル中のOODサンプルを検知し、それらを活用するフレームワークである。
論文 参考訳(メタデータ) (2022-05-25T09:29:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。