論文の概要: Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction
- arxiv url: http://arxiv.org/abs/2603.07438v1
- Date: Sun, 08 Mar 2026 03:22:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.59165
- Title: Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction
- Title(参考訳): ストレステストのための機械学習:カソーサルパネル予測における不確実性分解
- Authors: Yu Wang, Xiangchen Liu, Siguang Li,
- Abstract要約: 規制ストレステストでは、仮説的なマクロ経済シナリオの下で信用損失を予測する必要がある。
パネルにおけるポリシーパスの反ファクト推論のためのフレームワークを提案する。
実失業データを用いたシミュレーションおよび半合成実験により,すべての結果を検証した。
- 参考スコア(独自算出の注目度): 2.289837306672451
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Regulatory stress testing requires projecting credit losses under hypothetical macroeconomic scenarios -- a fundamentally causal question typically treated as a prediction problem. We propose a framework for policy-path counterfactual inference in panels that transparently separates what can be learned from data from what requires assumptions about confounding. Our approach has four components: (i) observational identification of path-conditional means via iterated regression, enabling continuous macro-path contrasts without requiring a control group; (ii) causal set identification under bounded confounding, yielding sharp identified sets with interpretable breakdown values that communicate robustness in a single number; (iii) an oracle inequality showing that recursive rollout error is governed by a horizon-dependent amplification factor, providing a concrete answer to how far ahead one can reliably predict under stress; and (iv) importance-weighted conformal calibration bands with diagnostics that quantify extrapolation cost and trigger abstention when coverage guarantees degrade. The final output is a three-layer uncertainty decomposition that cleanly separates estimation uncertainty from confounding uncertainty. We validate all results through simulation and semi-synthetic experiments with real unemployment data, including a Covid retrospective demonstrating the framework's diagnostic value under extreme scenarios.
- Abstract(参考訳): 規制的なストレステストでは、仮説的なマクロ経済シナリオの下で信用損失を予測する必要がある。
本稿では,データから学べるものと,コンバウンディングの前提となるものとを透過的に分離する,パネルにおける政策パス対実推論の枠組みを提案する。
このアプローチには4つのコンポーネントがあります。
一 経路条件付き手段の反復回帰による観察的識別であって、制御群を必要とせず、連続的なマクロパスコントラストを可能にすること。
(ii)有界共起の下での因果集合の識別は、1つの数でロバスト性を伝える解釈可能な分解値を持つ鋭い識別集合を生じる。
三 再帰的ロールアウト誤差が地平線依存増幅因子によって支配されていることを示し、ストレス下でどれだけ確実に予測できるかを具体的に答えるオラクル不等式
(4)外挿コストを定量化し,カバー範囲の低下を保証した場合の禁忌を誘発する診断装置を備えた重要重み付き共形キャリブレーションバンド。
最終的な出力は3層不確実性分解であり、不確実性から推定不確実性をきれいに分離する。
実失業データを用いたシミュレーションおよび半合成実験により、全ての結果を検証し、極端なシナリオ下でフレームワークの診断価値を実証するCovidレトロスペクティブを含む。
関連論文リスト
- Eidoku: A Neuro-Symbolic Verification Gate for LLM Reasoning via Structural Constraint Satisfaction [0.0]
大規模言語モデル(LLM)は、しばしば、モデル自身によって高い確率で割り当てられる幻覚文を生成する。
このことは、幻覚はしばしば低信頼現象ではなく、構造的整合性の失敗であることを示している。
我々は,LLM推論を,生成可能性とは独立に動作する制約満足度問題(CSP)として検証する。
論文 参考訳(メタデータ) (2025-12-19T05:29:43Z) - Calibrated Prediction Set in Fault Detection with Risk Guarantees via Significance Tests [3.500936878570599]
本稿では,形式的リスク保証を提供するために,コンフォメーション予測フレームワークと重要度テストを統合した新しい故障検出手法を提案する。
提案手法は,名目レベル以上の経験的カバレッジ率(1-alpha$)を一貫して達成する。
その結果、ユーザ定義のリスクレベル(alpha$)と効率の間のコントロール可能なトレードオフが明らかとなり、より高いリスク耐性が平均予測セットのサイズを小さくする。
論文 参考訳(メタデータ) (2025-08-02T05:49:02Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0]
動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-24T15:39:46Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。