論文の概要: Diffusion Transformers for Imputation: Statistical Efficiency and Uncertainty Quantification
- arxiv url: http://arxiv.org/abs/2510.02216v1
- Date: Thu, 02 Oct 2025 17:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.236796
- Title: Diffusion Transformers for Imputation: Statistical Efficiency and Uncertainty Quantification
- Title(参考訳): 数値計算用拡散変圧器:統計的効率と不確かさの定量化
- Authors: Zeqi Ye, Minshuo Chen,
- Abstract要約: 実用的な時系列データの品質向上には,命令手法が重要な役割を担っている。
拡散型生成的計算法は, 自己回帰法や従来の統計手法に比べ, 顕著な成功を収めている。
我々の研究は、拡散に基づくモデルが欠落した値と観測された値の間の複雑な空間的および時間的依存関係をどのように捉えるかという理論的理解に対処する。
- 参考スコア(独自算出の注目度): 19.497102911268843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imputation methods play a critical role in enhancing the quality of practical time-series data, which often suffer from pervasive missing values. Recently, diffusion-based generative imputation methods have demonstrated remarkable success compared to autoregressive and conventional statistical approaches. Despite their empirical success, the theoretical understanding of how well diffusion-based models capture complex spatial and temporal dependencies between the missing values and observed ones remains limited. Our work addresses this gap by investigating the statistical efficiency of conditional diffusion transformers for imputation and quantifying the uncertainty in missing values. Specifically, we derive statistical sample complexity bounds based on a novel approximation theory for conditional score functions using transformers, and, through this, construct tight confidence regions for missing values. Our findings also reveal that the efficiency and accuracy of imputation are significantly influenced by the missing patterns. Furthermore, we validate these theoretical insights through simulation and propose a mixed-masking training strategy to enhance the imputation performance.
- Abstract(参考訳): 命令法は、しばしば広範に欠落する値に悩まされる実用的な時系列データの品質を高める上で重要な役割を担っている。
近年, 自己回帰法や従来の統計手法に比べ, 拡散型誘導法は顕著な成功を収めている。
実験的な成功にもかかわらず、拡散に基づくモデルが欠落した値と観測された値の間の複雑な空間的および時間的依存関係をいかにうまく捉えるかの理論的理解は依然として限られている。
本研究は,不確かさを定量化するための条件拡散変圧器の統計的効率を検証し,不確かさを定量化することによって,このギャップに対処する。
具体的には,変圧器を用いた条件付きスコア関数に対する新しい近似理論に基づいて,統計的サンプルの複雑性境界を導出する。
また, 計算効率と精度が, 欠落パターンに大きく影響していることが判明した。
さらに,これらの理論的洞察をシミュレーションにより検証し,計算性能を向上させるための混合マスキングトレーニング戦略を提案する。
関連論文リスト
- Temporal Distribution Shift in Real-World Pharmaceutical Data: Implications for Uncertainty Quantification in QSAR Models [1.9354018523009415]
機械学習モデルにおける予測の不確実性を推定するいくつかの計算ツールが存在する。
I. I. D. 設定からの逸脱は これらの不確実な定量化方法のパフォーマンスを損なうことが示されている。
我々は,不確実性評価手法の総合的,大規模評価の必要性に対処するために,現実世界の医薬品データセットを用いている。
論文 参考訳(メタデータ) (2025-02-06T11:26:04Z) - Model Free Prediction with Uncertainty Assessment [7.524024486998338]
そこで本研究では,深部推定パラダイムを条件付き平均推定を行うプラットフォームに変換する新しいフレームワークを提案する。
本研究では, 条件付き拡散モデルに対する終端収束率を開発し, 生成した試料の正規性を確立する。
数値実験により,提案手法の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-05-21T11:19:50Z) - Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。
本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。
そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2024-01-17T07:58:18Z) - Unmasking Bias in Diffusion Model Training [40.90066994983719]
拡散モデルが画像生成の主流のアプローチとして登場した。
トレーニングの収束が遅く、サンプリングのカラーシフトの問題に悩まされている。
本稿では,これらの障害は,既定のトレーニングパラダイムに固有のバイアスや準最適性に大きく起因していると考えられる。
論文 参考訳(メタデータ) (2023-10-12T16:04:41Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Uncertainty-Gated Stochastic Sequential Model for EHR Mortality
Prediction [6.170898159041278]
本稿では,欠落変数の分布を推定し,隠れ状態の更新を行い,院内死亡の可能性を予測できる新しい変動再帰ネットワークを提案する。
我々のモデルは、これらの手順を1つのストリームで実行し、エンドツーエンドで全てのネットワークパラメータを共同で学習できることは注目に値する。
論文 参考訳(メタデータ) (2020-03-02T04:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。