論文の概要: An Information-Theoretic Framework for Credit Risk Modeling: Unifying Industry Practice with Statistical Theory for Fair and Interpretable Scorecards
- arxiv url: http://arxiv.org/abs/2509.09855v1
- Date: Thu, 11 Sep 2025 21:05:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:07.923861
- Title: An Information-Theoretic Framework for Credit Risk Modeling: Unifying Industry Practice with Statistical Theory for Fair and Interpretable Scorecards
- Title(参考訳): 信用リスクモデリングのための情報理論フレームワーク:公正かつ解釈可能なスコアカードの統計理論と産業実践の統合
- Authors: Agus Sudjianto, Denis Burakov,
- Abstract要約: IVは、同一のビン上での善と悪のクレジット結果とで計算されたPSIと完全に等しいことを示す。
我々は、クレジットモデリング固有のパフォーマンス・フェアネストレードオフを、IVの予測パワーを最大化しつつ、IVの保護属性を最小化するものとして定式化する。
この枠組みは理論と実践を橋渡しし、広く使用されている信用リスク指標の厳密な統計基盤を提供する。
- 参考スコア(独自算出の注目度): 1.4824891788575416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Credit risk modeling relies extensively on Weight of Evidence (WoE) and Information Value (IV) for feature engineering, and Population Stability Index (PSI) for drift monitoring, yet their theoretical foundations remain disconnected. We establish a unified information-theoretic framework revealing these industry-standard metrics as instances of classical information divergences. Specifically, we prove that IV exactly equals PSI (Jeffreys divergence) computed between good and bad credit outcomes over identical bins. Through the delta method applied to WoE transformations, we derive standard errors for IV and PSI, enabling formal hypothesis testing and probabilistic fairness constraints for the first time. We formalize credit modeling's inherent performance-fairness trade-off as maximizing IV for predictive power while minimizing IV for protected attributes. Using automated binning with depth-1 XGBoost stumps, we compare three encoding strategies: logistic regression with one-hot encoding, WoE transformation, and constrained XGBoost. All methods achieve comparable predictive performance (AUC 0.82-0.84), demonstrating that principled, information-theoretic binning outweighs encoding choice. Mixed-integer programming traces Pareto-efficient solutions along the performance-fairness frontier with uncertainty quantification. This framework bridges theory and practice, providing the first rigorous statistical foundation for widely-used credit risk metrics while offering principled tools for balancing accuracy and fairness in regulated environments.
- Abstract(参考訳): 信用リスクモデリングは、特徴工学におけるウェイト・オブ・エビデンス (WoE) とインフォメーション・バリュー (IV) 、ドリフトモニタリングにおける人口安定指数 (PSI) に大きく依存しているが、理論基盤はいまだに切り離されている。
我々は、これらの業界標準メトリクスを古典的な情報分散の例として明らかにする統合情報理論の枠組みを確立した。
具体的には、同一のビン上での善と悪のクレジット結果の間で計算されたPSI(Jeffreys divergence)と全く同じであることを示す。
WoE変換に適用したデルタ法により、IV と PSI の標準誤差を導出し、公式な仮説テストと確率的公正性制約を初めて実現した。
我々は、クレジットモデリング固有のパフォーマンス・フェアネストレードオフを、IVの予測パワーを最大化しつつ、IVの保護属性を最小化するものとして定式化する。
深度1のXGBoostスタンプによる自動ビンニングを用いて、ロジスティック回帰とワンホットエンコーディング、WoE変換、制約付きXGBoostの3つのエンコーディング戦略を比較する。
全ての手法が同等の予測性能(AUC 0.82-0.84)を達成し、情報理論的なバイナリ化が符号化の選択よりも優れていることを示す。
混合整数プログラミングは、不確実な定量化を伴うパフォーマンスフェアネスフロンティアに沿ったパレート効率のソリューションをトレースする。
この枠組みは理論と実践を橋渡しし、広く使用されている信用リスク指標の厳密な統計基盤を提供すると同時に、規制された環境における正確性と公正性のバランスをとるための原則化されたツールを提供する。
関連論文リスト
- Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments [5.5855749614100825]
本稿では,複数の事前学習モデルを活用することで,このリコール低減を緩和できるという仮説を述べる。
我々は,一貫性に基づく推論問題として,様々なモデルからの矛盾する予測を特定し,管理することの課題を定式化する。
本研究は,複数の不完全なモデルから得られた知識を,難易度の高い新しいシナリオにおいて堅牢に統合するための効果的なメカニズムとして,一貫性に基づく誘拐の有効性を検証するものである。
論文 参考訳(メタデータ) (2025-05-25T23:17:47Z) - Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0]
動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-24T15:39:46Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Trust but Verify: Assigning Prediction Credibility by Counterfactual
Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。
これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。
この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文 参考訳(メタデータ) (2020-11-24T19:52:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。