Fugu-MT 論文翻訳(概要): Revisiting Diffusion Model Predictions Through Dimensionality

論文の概要: Revisiting Diffusion Model Predictions Through Dimensionality

arxiv url: http://arxiv.org/abs/2601.21419v1
Date: Thu, 29 Jan 2026 08:56:55 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-30 16:22:49.682642
Title: Revisiting Diffusion Model Predictions Through Dimensionality
Title（参考訳）: 次元による拡散モデル予測の再検討
Authors: Qing Jin, Chaoyang Wang,
Abstract要約: 近年の拡散・流れマッチングモデルの発展により, 予測対象のシフトが顕著になった。任意の出力目標に対応する一般化予測式に基づく理論的枠組みを提供する。我々は,データから最適な予測パラメータkを直接学習するために,データ駆動型アプローチを用いるフレームワークであるk-Diffを提案する。
参考スコア（独自算出の注目度）: 6.277362418411825
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent advances in diffusion and flow matching models have highlighted a shift in the preferred prediction target -- moving from noise ($\varepsilon$) and velocity (v) to direct data (x) prediction -- particularly in high-dimensional settings. However, a formal explanation of why the optimal target depends on the specific properties of the data remains elusive. In this work, we provide a theoretical framework based on a generalized prediction formulation that accommodates arbitrary output targets, of which $\varepsilon$-, v-, and x-prediction are special cases. We derive the analytical relationship between data's geometry and the optimal prediction target, offering a rigorous justification for why x-prediction becomes superior when the ambient dimension significantly exceeds the data's intrinsic dimension. Furthermore, while our theory identifies dimensionality as the governing factor for the optimal prediction target, the intrinsic dimension of manifold-bound data is typically intractable to estimate in practice. To bridge this gap, we propose k-Diff, a framework that employs a data-driven approach to learn the optimal prediction parameter k directly from data, bypassing the need for explicit dimension estimation. Extensive experiments in both latent-space and pixel-space image generation demonstrate that k-Diff consistently outperforms fixed-target baselines across varying architectures and data scales, providing a principled and automated approach to enhancing generative performance.
Abstract（参考訳）: 拡散モデルと流れマッチングモデルの最近の進歩は、特に高次元設定において、好ましい予測対象であるノイズ(\varepsilon$)とベロシティ(v)から直接データ(x)予測へのシフトを浮き彫りにした。しかし、なぜ最適なターゲットがデータの特定の性質に依存するのかという公式な説明は、いまだ解明されていない。本研究では、任意の出力ターゲットに対応する一般化予測式に基づく理論的枠組みを提供する。我々は、データ幾何学と最適予測対象との分析的関係を導出し、外界次元がデータ固有の次元を大幅に上回る場合、なぜ x-プレディションが優れているのかを厳密な正当化を与える。さらに,本理論では,次元を最適予測対象の制御因子とみなす一方で,多様体有界データの本質的な次元は,実際は推定に難渋することが多い。このギャップを埋めるために、データ駆動型アプローチを用いてデータから最適な予測パラメータkを直接学習し、明示的な次元推定の必要性を回避したk-Diffを提案する。潜在空間と画素空間の両方の画像生成における大規模な実験により、k-Diffは様々なアーキテクチャやデータスケールで一貫して固定ターゲットベースラインを上回り、生成性能を向上させるための原則的かつ自動化されたアプローチを提供する。

関連論文リスト

Supervised Dynamic Dimension Reduction with Deep Neural Network [3.0040661953201475]
本稿では,新しい動的主成分分析フレームワークであるSupervised Deep Dynamic principalを提案する。我々は、元の予測を教師付きでスケーリングすることで、ターゲット対応予測器を構築する。次に、ターゲット認識予測器上で主成分分析を行い、推定されたSDDP因子を抽出する。
論文参考訳（メタデータ） (2025-08-05T15:15:30Z)
Deep Partially Linear Transformation Model for Right-Censored Survival Data [6.315323176162257]
本稿では, 汎用かつ柔軟な回帰フレームワークとして, 深部部分線形変換モデル(DPLTM)を提案する。提案手法は, 興味あるコセンサーの解釈可能性を維持しつつ, 次元の呪いを避けることができる。総合シミュレーション研究は,提案手法の精度と予測力の両面から,優れた性能を示すものである。
論文参考訳（メタデータ） (2024-12-10T15:50:43Z)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。これらの課題に対処するための影響関数フレームワークを開発する。
論文参考訳（メタデータ） (2024-10-17T17:59:02Z)
Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文参考訳（メタデータ） (2023-11-30T18:59:44Z)
Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。 EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文参考訳（メタデータ） (2023-04-17T10:59:57Z)
Uncertainty-guided Source-free Domain Adaptation [77.3844160723014]
ソースフリードメイン適応(SFDA)は、事前訓練されたソースモデルのみを使用することで、未ラベルのターゲットデータセットに分類器を適応させることを目的としている。本稿では、ソースモデル予測の不確実性を定量化し、ターゲット適応の導出に利用することを提案する。
論文参考訳（メタデータ） (2022-08-16T08:03:30Z)
Which Invariance Should We Transfer? A Causal Minimax Learning Approach [18.71316951734806]
本稿では、因果的観点からの包括的ミニマックス分析について述べる。最小の最悪のリスクを持つサブセットを探索する効率的なアルゴリズムを提案する。本手法の有効性と有効性は, 合成データとアルツハイマー病の診断で実証された。
論文参考訳（メタデータ） (2021-07-05T09:07:29Z)
DeepKriging: Spatially Dependent Deep Neural Networks for Spatial Prediction [2.219504240642369]
空間統計学において、共通の目的は、空間依存を利用して、観測されていない場所での空間過程の値を予測することである。 DeepKriging法はガウスの場合にはKrigingと直接リンクしており、非ガウスおよび非定常データに対してKrigingよりも多くの利点がある。本手法を米国大陸におけるPM2.5濃度の予測に適用する。
論文参考訳（メタデータ） (2020-07-23T12:38:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。