論文の概要: Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting
- arxiv url: http://arxiv.org/abs/2603.06733v1
- Date: Fri, 06 Mar 2026 04:40:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.004824
- Title: Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting
- Title(参考訳): Calibrated Credit Intelligence: シフト・ロバストと公正リスク、ベイジアン不確実性とグラディエント・ブースティング
- Authors: Srikumar Nayak,
- Abstract要約: Calibrated Credit Intelligence(CCI)は、リスクスコアリングのためのデプロイメント指向のフレームワークである。
CCIは、現実的な展開条件下で、正確で信頼性があり、より公平なリスクスコアを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Credit risk scoring must support high-stakes lending decisions where data distributions change over time, probability estimates must be reliable, and group-level fairness is required. While modern machine learning models improve default prediction accuracy, they often produce poorly calibrated scores under distribution shift and may create unfair outcomes when trained without explicit constraints. This paper proposes Calibrated Credit Intelligence (CCI), a deployment-oriented framework that combines (i) a Bayesian neural risk scorer to capture epistemic uncertainty and reduce overconfident errors, (ii) a fairnessconstrained gradient boosting model to control group disparities while preserving strong tabular performance, and (iii) a shiftaware fusion strategy followed by post-hoc probability calibration to stabilize decision thresholds in later time periods. We evaluate CCI on the Home Credit Credit Risk Model Stability benchmark using a time-consistent split to reflect real-world drift. Compared with strong baselines (LightGBM, XGBoost, CatBoost, TabNet, and a standalone Bayesian neural model), CCI achieves the best overall trade-off between discrimination, calibration, stability, and fairness. In particular, CCI reaches an AUC-ROC of 0.912 and an AUC-PR of 0.438, improves operational performance with Recall@1%FPR = 0.509, and reduces calibration error (Brier score 0.087, ECE 0.015). Under temporal shift, CCI shows a smaller AUC-PR drop from early to late periods (0.017), and it lowers group disparities (demographic parity gap 0.046, equal opportunity gap 0.037) compared to unconstrained boosting. These results indicate that CCI produces risk scores that are accurate, reliable, and more equitable under realistic deployment conditions.
- Abstract(参考訳): 信用リスクスコアリング(Credit risk score)は、データ分散が時間とともに変化する場合、確率推定が信頼できること、グループレベルの公正性が必要な場合、高リスク融資決定をサポートする必要がある。
現代の機械学習モデルでは、デフォルトの予測精度が向上する一方、分散シフト下では校正が不十分なスコアを生成し、明示的な制約なしにトレーニングされた場合、不公平な結果が発生する可能性がある。
本稿では、デプロイ指向のフレームワークであるCalibrated Credit Intelligence(CCI)を提案する。
一 ベイズ的神経リスクスコアラーで、てんかんの不確かさを捉え、過信エラーを低減すること。
二 厳格な表形式性能を維持しつつ、群差を制御するための公正制約付き勾配促進モデル
三 後期の意思決定閾値を安定させるために、シフトアウェア融合戦略の後、保温後の確率校正を行う。
我々は、実世界のドリフトを反映した時間一貫性スプリットを用いて、ホームクレジット信用リスクモデル安定性ベンチマークでCCIを評価した。
強力なベースライン(LightGBM、XGBoost、CatBoost、TabNet、およびスタンドアロンのベイズニューラルモデル)と比較すると、CCIは差別、校正、安定性、公正性のトレードオフとして最高のものである。
特に、CCIは0.912のAUC-ROCと0.438のAUC-PRに達し、Recall@1%FPR = 0.509の操作性能を改善し、校正誤差を低減する(Brier score 0.087, ECE 0.015)。
時間的シフトの下では、CCIはAUC-PRの低下を早期から後期(0.017)に減少させ、グループ格差(デコグラフィーパリティギャップ0.046、等機会ギャップ0.037)を非拘束的な上昇と比較して低下させる。
これらの結果は、CCIが現実的な展開条件下で、正確で信頼性があり、より公平なリスクスコアを生成することを示唆している。
関連論文リスト
- Margin and Consistency Supervision for Calibrated and Robust Vision Models [1.0152838128195467]
Margin and Consistency Supervision (MaCS)は、アーキテクチャに依存しないシンプルな正規化フレームワークである。
MACSはロジト空間分離と局所予測安定性を共同で実施する。
我々は,リプシッツ型安定性プロキシにより定式化された局所感度を低下させながら,分類マージンを増大させることにより,一般化の保証が向上することを示した。
論文 参考訳(メタデータ) (2026-03-06T01:54:28Z) - Learning Robust Representations for Malicious Content Detection via Contrastive Sampling and Uncertainty Estimation [0.0]
不確実性コントラストフレームワーク(UCF)は、不確実性を考慮したコントラスト損失、適応温度スケーリング、自己注意誘導型LSTMエンコーダを統合し、ノイズおよび不均衡条件下での分類を改善する。
UCFはサンプルの信頼度に基づいて対照的な重み付けを動的に調整し、正のアンカーを用いたトレーニングを安定化し、温度パラメータをバッチレベルの可変性に適応させる。
論文 参考訳(メタデータ) (2025-12-01T22:06:06Z) - Optimizing Chain-of-Thought Confidence via Topological and Dirichlet Risk Analysis [3.4324137096523746]
チェーン・オブ・シークレットのプロンプトにより、大規模言語モデルは複雑な問題を解決することができる。
既存の手法では、誤った予測に対するキャリブレーションの低下と深刻な過信に悩まされている。
複数の推論経路にまたがる信頼度を測定するために,拡張ディリクレ・トポロジーリスク(EDTR)を提案する。
論文 参考訳(メタデータ) (2025-11-09T16:09:02Z) - Revisiting Reweighted Risk for Calibration: AURC, Focal, and Inverse Focal Loss [24.141034387131267]
深層学習で一般的に用いられる重み付きリスク関数のクラスを再検討し,キャリブレーション誤差と選択分類の原則的関連性を確立する。
キャリブレーション誤差の最小化は選択的分類パラダイムと密接に関連していることを示し、低信頼領域における選択的リスクの最適化が自然にキャリブレーションの改善につながることを示した。
論文 参考訳(メタデータ) (2025-05-29T14:12:12Z) - Aurora: Are Android Malware Classifiers Reliable and Stable under Distribution Shift? [51.12297424766236]
AURORAは、その信頼性と運用上のレジリエンスに基づいて、マルウェア分類器を評価するためのフレームワークである。
AURORAは、ポイント・イン・タイムのパフォーマンスを超えるように設計されたメトリクスのセットによって補完される。
さまざまなドリフトのデータセットにわたるSOTAフレームワークの脆弱性は、ホワイトボードへの復帰の必要性を示唆している。
論文 参考訳(メタデータ) (2025-05-28T20:22:43Z) - Safe Deployment for Counterfactual Learning to Rank with Exposure-Based
Risk Minimization [63.93275508300137]
本稿では,安全な配置を理論的に保証する新たなリスク認識型対実学習ランク法を提案する。
提案手法の有効性を実験的に検証し,データが少ない場合の動作不良の早期回避に有効であることを示す。
論文 参考訳(メタデータ) (2023-04-26T15:54:23Z) - Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。
信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文 参考訳(メタデータ) (2023-01-25T19:35:23Z) - Beyond calibration: estimating the grouping loss of modern neural
networks [68.8204255655161]
適切なスコアリングルール理論は、キャリブレーション損失が与えられた場合、個々のエラーを特徴づける欠片がグループ化損失であることを示している。
視覚およびNLPにおける現代のニューラルネットワークアーキテクチャは、特に分散シフト設定においてグループ化損失を示す。
論文 参考訳(メタデータ) (2022-10-28T07:04:20Z) - Robustness and Accuracy Could Be Reconcilable by (Proper) Definition [109.62614226793833]
強靭性と精度のトレードオフは、敵文学において広く研究されている。
局所的不変性の帰納的バイアスを課す不適切に定義された頑健な誤差に由来する可能性がある。
定義上、SCOREは、最悪のケースの不確実性に対処しながら、堅牢性と正確性の間の和解を促進する。
論文 参考訳(メタデータ) (2022-02-21T10:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。