論文の概要: Diffusion Transformers for Imputation: Statistical Efficiency and Uncertainty Quantification
- arxiv url: http://arxiv.org/abs/2510.02216v1
- Date: Thu, 02 Oct 2025 17:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.236796
- Title: Diffusion Transformers for Imputation: Statistical Efficiency and Uncertainty Quantification
- Title(参考訳): 数値計算用拡散変圧器:統計的効率と不確かさの定量化
- Authors: Zeqi Ye, Minshuo Chen,
- Abstract要約: 実用的な時系列データの品質向上には,命令手法が重要な役割を担っている。
拡散型生成的計算法は, 自己回帰法や従来の統計手法に比べ, 顕著な成功を収めている。
我々の研究は、拡散に基づくモデルが欠落した値と観測された値の間の複雑な空間的および時間的依存関係をどのように捉えるかという理論的理解に対処する。
- 参考スコア(独自算出の注目度): 19.497102911268843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imputation methods play a critical role in enhancing the quality of practical time-series data, which often suffer from pervasive missing values. Recently, diffusion-based generative imputation methods have demonstrated remarkable success compared to autoregressive and conventional statistical approaches. Despite their empirical success, the theoretical understanding of how well diffusion-based models capture complex spatial and temporal dependencies between the missing values and observed ones remains limited. Our work addresses this gap by investigating the statistical efficiency of conditional diffusion transformers for imputation and quantifying the uncertainty in missing values. Specifically, we derive statistical sample complexity bounds based on a novel approximation theory for conditional score functions using transformers, and, through this, construct tight confidence regions for missing values. Our findings also reveal that the efficiency and accuracy of imputation are significantly influenced by the missing patterns. Furthermore, we validate these theoretical insights through simulation and propose a mixed-masking training strategy to enhance the imputation performance.
- Abstract(参考訳): 命令法は、しばしば広範に欠落する値に悩まされる実用的な時系列データの品質を高める上で重要な役割を担っている。
近年, 自己回帰法や従来の統計手法に比べ, 拡散型誘導法は顕著な成功を収めている。
実験的な成功にもかかわらず、拡散に基づくモデルが欠落した値と観測された値の間の複雑な空間的および時間的依存関係をいかにうまく捉えるかの理論的理解は依然として限られている。
本研究は,不確かさを定量化するための条件拡散変圧器の統計的効率を検証し,不確かさを定量化することによって,このギャップに対処する。
具体的には,変圧器を用いた条件付きスコア関数に対する新しい近似理論に基づいて,統計的サンプルの複雑性境界を導出する。
また, 計算効率と精度が, 欠落パターンに大きく影響していることが判明した。
さらに,これらの理論的洞察をシミュレーションにより検証し,計算性能を向上させるための混合マスキングトレーニング戦略を提案する。
関連論文リスト
- Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - A Generative Framework for Causal Estimation via Importance-Weighted Diffusion Distillation [55.53426007439564]
観察データから個別化された治療効果を推定することは因果推論における中心的な課題である。
逆確率重み付け(IPW)は、この問題に対するよく確立された解決策であるが、現代のディープラーニングフレームワークへの統合は依然として限られている。
本稿では,拡散モデルの事前学習と重み付きスコア蒸留を組み合わせた新しい生成フレームワークであるIWDDを提案する。
論文 参考訳(メタデータ) (2025-05-16T17:00:52Z) - Temporal Distribution Shift in Real-World Pharmaceutical Data: Implications for Uncertainty Quantification in QSAR Models [1.9354018523009415]
機械学習モデルにおける予測の不確実性を推定するいくつかの計算ツールが存在する。
I. I. D. 設定からの逸脱は これらの不確実な定量化方法のパフォーマンスを損なうことが示されている。
我々は,不確実性評価手法の総合的,大規模評価の必要性に対処するために,現実世界の医薬品データセットを用いている。
論文 参考訳(メタデータ) (2025-02-06T11:26:04Z) - Model Free Prediction with Uncertainty Assessment [7.524024486998338]
そこで本研究では,深部推定パラダイムを条件付き平均推定を行うプラットフォームに変換する新しいフレームワークを提案する。
本研究では, 条件付き拡散モデルに対する終端収束率を開発し, 生成した試料の正規性を確立する。
数値実験により,提案手法の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-05-21T11:19:50Z) - Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。
本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。
そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2024-01-17T07:58:18Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Unmasking Bias in Diffusion Model Training [40.90066994983719]
拡散モデルが画像生成の主流のアプローチとして登場した。
トレーニングの収束が遅く、サンプリングのカラーシフトの問題に悩まされている。
本稿では,これらの障害は,既定のトレーニングパラダイムに固有のバイアスや準最適性に大きく起因していると考えられる。
論文 参考訳(メタデータ) (2023-10-12T16:04:41Z) - Counterfactual Generative Models for Time-Varying Treatments [15.208067770012283]
公衆衛生・臨床科学における意思決定には, 治療の非現実的な結果の推定が不可欠である。
そこで本研究では, 時間変化処理下で, 反実例を生成できる新しい条件生成フレームワークを提案する。
合成データと実世界のデータの両方を用いて,本手法の徹底的な評価を行う。
論文 参考訳(メタデータ) (2023-05-25T05:45:53Z) - Adapting to Continuous Covariate Shift via Online Density Ratio Estimation [64.8027122329609]
分散シフトへの対処は、現代の機械学習における中心的な課題の1つだ。
歴史的情報を適切に再利用するオンライン手法を提案する。
我々の密度比推定法は, ダイナミックなリセットバウンドを楽しむことにより, 良好に動作できることが証明された。
論文 参考訳(メタデータ) (2023-02-06T04:03:33Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Uncertainty-Gated Stochastic Sequential Model for EHR Mortality
Prediction [6.170898159041278]
本稿では,欠落変数の分布を推定し,隠れ状態の更新を行い,院内死亡の可能性を予測できる新しい変動再帰ネットワークを提案する。
我々のモデルは、これらの手順を1つのストリームで実行し、エンドツーエンドで全てのネットワークパラメータを共同で学習できることは注目に値する。
論文 参考訳(メタデータ) (2020-03-02T04:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。