論文の概要: Revisiting Diffusion Model Predictions Through Dimensionality
- arxiv url: http://arxiv.org/abs/2601.21419v1
- Date: Thu, 29 Jan 2026 08:56:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.682642
- Title: Revisiting Diffusion Model Predictions Through Dimensionality
- Title(参考訳): 次元による拡散モデル予測の再検討
- Authors: Qing Jin, Chaoyang Wang,
- Abstract要約: 近年の拡散・流れマッチングモデルの発展により, 予測対象のシフトが顕著になった。
任意の出力目標に対応する一般化予測式に基づく理論的枠組みを提供する。
我々は,データから最適な予測パラメータkを直接学習するために,データ駆動型アプローチを用いるフレームワークであるk-Diffを提案する。
- 参考スコア(独自算出の注目度): 6.277362418411825
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in diffusion and flow matching models have highlighted a shift in the preferred prediction target -- moving from noise ($\varepsilon$) and velocity (v) to direct data (x) prediction -- particularly in high-dimensional settings. However, a formal explanation of why the optimal target depends on the specific properties of the data remains elusive. In this work, we provide a theoretical framework based on a generalized prediction formulation that accommodates arbitrary output targets, of which $\varepsilon$-, v-, and x-prediction are special cases. We derive the analytical relationship between data's geometry and the optimal prediction target, offering a rigorous justification for why x-prediction becomes superior when the ambient dimension significantly exceeds the data's intrinsic dimension. Furthermore, while our theory identifies dimensionality as the governing factor for the optimal prediction target, the intrinsic dimension of manifold-bound data is typically intractable to estimate in practice. To bridge this gap, we propose k-Diff, a framework that employs a data-driven approach to learn the optimal prediction parameter k directly from data, bypassing the need for explicit dimension estimation. Extensive experiments in both latent-space and pixel-space image generation demonstrate that k-Diff consistently outperforms fixed-target baselines across varying architectures and data scales, providing a principled and automated approach to enhancing generative performance.
- Abstract(参考訳): 拡散モデルと流れマッチングモデルの最近の進歩は、特に高次元設定において、好ましい予測対象であるノイズ(\varepsilon$)とベロシティ(v)から直接データ(x)予測へのシフトを浮き彫りにした。
しかし、なぜ最適なターゲットがデータの特定の性質に依存するのかという公式な説明は、いまだ解明されていない。
本研究では、任意の出力ターゲットに対応する一般化予測式に基づく理論的枠組みを提供する。
我々は、データ幾何学と最適予測対象との分析的関係を導出し、外界次元がデータ固有の次元を大幅に上回る場合、なぜ x-プレディションが優れているのかを厳密な正当化を与える。
さらに,本理論では,次元を最適予測対象の制御因子とみなす一方で,多様体有界データの本質的な次元は,実際は推定に難渋することが多い。
このギャップを埋めるために、データ駆動型アプローチを用いてデータから最適な予測パラメータkを直接学習し、明示的な次元推定の必要性を回避したk-Diffを提案する。
潜在空間と画素空間の両方の画像生成における大規模な実験により、k-Diffは様々なアーキテクチャやデータスケールで一貫して固定ターゲットベースラインを上回り、生成性能を向上させるための原則的かつ自動化されたアプローチを提供する。
関連論文リスト
- Supervised Dynamic Dimension Reduction with Deep Neural Network [3.0040661953201475]
本稿では,新しい動的主成分分析フレームワークであるSupervised Deep Dynamic principalを提案する。
我々は、元の予測を教師付きでスケーリングすることで、ターゲット対応予測器を構築する。
次に、ターゲット認識予測器上で主成分分析を行い、推定されたSDDP因子を抽出する。
論文 参考訳(メタデータ) (2025-08-05T15:15:30Z) - Data-Driven Forecasting of High-Dimensional Transient and Stationary Processes via Space-Time Projection [0.0]
時空間投影(STP)は,高次元および時間分解データに対するデータ駆動予測手法として導入された。
この方法は、後流と予測間隔の両方からなる予測水平線にまたがるトレーニングデータから、拡張時空間固有モードを算出する。
論文 参考訳(メタデータ) (2025-03-31T03:36:59Z) - Deep Partially Linear Transformation Model for Right-Censored Survival Data [6.315323176162257]
本稿では, 汎用かつ柔軟な回帰フレームワークとして, 深部部分線形変換モデル(DPLTM)を提案する。
提案手法は, 興味あるコセンサーの解釈可能性を維持しつつ, 次元の呪いを避けることができる。
総合シミュレーション研究は,提案手法の精度と予測力の両面から,優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-12-10T15:50:43Z) - Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
これらの課題に対処するための影響関数フレームワークを開発する。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Quasi-Bayes meets Vines [2.3124143670964448]
我々は、スクラーの定理を用いて、準ベイズ予想を高次元に拡張する別の方法を提案する。
提案した準ベイジアンVine (QB-Vine) は完全に非パラメトリックな密度推定器であることを示す。
論文 参考訳(メタデータ) (2024-06-18T16:31:02Z) - Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。
我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Variational Inference with Coverage Guarantees in Simulation-Based Inference [18.818573945984873]
コンフォーマル化補正ニューラル変分推論(CANVI)を提案する。
CANVIは各候補に基づいて共形予測器を構築し、予測効率と呼ばれる計量を用いて予測器を比較し、最も効率的な予測器を返す。
我々は,CANVIが生成する領域の予測効率の低い境界を証明し,その近似に基づいて,後部近似の品質と予測領域の予測効率の関係について検討する。
論文 参考訳(メタデータ) (2023-05-23T17:24:04Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Uncertainty-guided Source-free Domain Adaptation [77.3844160723014]
ソースフリードメイン適応(SFDA)は、事前訓練されたソースモデルのみを使用することで、未ラベルのターゲットデータセットに分類器を適応させることを目的としている。
本稿では、ソースモデル予測の不確実性を定量化し、ターゲット適応の導出に利用することを提案する。
論文 参考訳(メタデータ) (2022-08-16T08:03:30Z) - CovarianceNet: Conditional Generative Model for Correct Covariance
Prediction in Human Motion Prediction [71.31516599226606]
本稿では,将来の軌道の予測分布に関連する不確かさを正確に予測する手法を提案する。
我々のアプローチであるCovariaceNetは、ガウス潜在変数を持つ条件付き生成モデルに基づいている。
論文 参考訳(メタデータ) (2021-09-07T09:38:24Z) - Which Invariance Should We Transfer? A Causal Minimax Learning Approach [18.71316951734806]
本稿では、因果的観点からの包括的ミニマックス分析について述べる。
最小の最悪のリスクを持つサブセットを探索する効率的なアルゴリズムを提案する。
本手法の有効性と有効性は, 合成データとアルツハイマー病の診断で実証された。
論文 参考訳(メタデータ) (2021-07-05T09:07:29Z) - DeepKriging: Spatially Dependent Deep Neural Networks for Spatial
Prediction [2.219504240642369]
空間統計学において、共通の目的は、空間依存を利用して、観測されていない場所での空間過程の値を予測することである。
DeepKriging法はガウスの場合にはKrigingと直接リンクしており、非ガウスおよび非定常データに対してKrigingよりも多くの利点がある。
本手法を米国大陸におけるPM2.5濃度の予測に適用する。
論文 参考訳(メタデータ) (2020-07-23T12:38:53Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。