論文の概要: Predicting Mortgage Default with Machine Learning: AutoML, Class Imbalance, and Leakage Control
- arxiv url: http://arxiv.org/abs/2602.00120v1
- Date: Tue, 27 Jan 2026 15:25:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:32.954065
- Title: Predicting Mortgage Default with Machine Learning: AutoML, Class Imbalance, and Leakage Control
- Title(参考訳): 機械学習によるMortgageデフォルトの予測 - AutoML、クラス不均衡、漏洩制御
- Authors: Xianghong Hu, Tianning Xu, Ying Chen, Shuai Wang,
- Abstract要約: 実世界のローンレベルのデータセットを用いて、住宅ローンのデフォルト予測に複数の機械学習アプローチを比較した。
我々は、発端と報告期間の両方を制約する厳格な時間分割である漏洩認識機能選択を採用する。
複数の正対負の比率で、性能は安定であり、AutoMLアプローチは評価されたモデルの中で最強のAUROCを達成する。
- 参考スコア(独自算出の注目度): 7.5947844798897535
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Mortgage default prediction is a core task in financial risk management, and machine learning models are increasingly used to estimate default probabilities and provide interpretable signals for downstream decisions. In real-world mortgage datasets, however, three factors frequently undermine evaluation validity and deployment reliability: ambiguity in default labeling, severe class imbalance, and information leakage arising from temporal structure and post-event variables. We compare multiple machine learning approaches for mortgage default prediction using a real-world loan-level dataset, with emphasis on leakage control and imbalance handling. We employ leakage-aware feature selection, a strict temporal split that constrains both origination and reporting periods, and controlled downsampling of the majority class. Across multiple positive-to-negative ratios, performance remains stable, and an AutoML approach (AutoGluon) achieves the strongest AUROC among the models evaluated. An extended and pedagogical version of this work will appear as a book chapter.
- Abstract(参考訳): Mortgageのデフォルト予測は、金融リスク管理における中核的なタスクであり、マシンラーニングモデルは、デフォルトの確率を推定し、下流の意思決定に解釈可能な信号を提供するために、ますます使用されている。
しかし、現実の住宅ローンデータセットでは、デフォルトのラベル付けにおける曖昧さ、厳密なクラス不均衡、時間的構造やポストイベント変数から生じる情報漏洩の3つの要因が評価の妥当性とデプロイメントの信頼性を損なうことがよくある。
実世界のローンレベルのデータセットを用いて、住宅ローンのデフォルト予測のための複数の機械学習アプローチを比較し、漏洩制御と不均衡処理に重点を置いている。
リークを意識した特徴選択は、発端と報告期間の両方を制約する厳格な時間分割であり、多数派のダウンサンプリングを制御する。
複数の正対負の比率で、性能は安定であり、AutoMLアプローチ(AutoGluon)は評価されたモデルの中で最強のAUROCを達成する。
この作品の拡張版と教育版が本章として登場する。
関連論文リスト
- Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Interpretable Credit Default Prediction with Ensemble Learning and SHAP [3.948008559977866]
本研究では、信用デフォルト予測の問題に焦点をあて、機械学習に基づくモデリングフレームワークを構築し、様々な主流分類アルゴリズムの比較実験を行う。
その結果、アンサンブル学習法は、特に特徴とデータ不均衡問題の間の複雑な非線形関係を扱う際に、予測性能に明らかな利点があることが示唆された。
外部クレジットスコア変数はモデル決定において主要な役割を担い、モデルの解釈可能性と実用的な応用価値を改善するのに役立ちます。
論文 参考訳(メタデータ) (2025-05-27T07:23:22Z) - A Spatio-Temporal Machine Learning Model for Mortgage Credit Risk: Default Probabilities and Loan Portfolios [11.141688859736805]
本稿では,木ブースティングと遅延時間プロセスモデルとガウスプロセスモデルを組み合わせることで,信用リスクの機械学習モデルを提案する。
個人ローンに対する予測的デフォルト確率と予測的ローンポートフォリオ損失分布は、従来の独立した線形ハザードモデルと比較してより正確であることがわかった。
論文 参考訳(メタデータ) (2024-10-03T15:10:55Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Provable tradeoffs in adversarially robust classification [96.48180210364893]
我々は、ロバストなイソペリメトリに関する確率論の最近のブレークスルーを含む、新しいツールを開発し、活用する。
この結果から,データの不均衡時に増加する標準精度とロバスト精度の基本的なトレードオフが明らかになった。
論文 参考訳(メタデータ) (2020-06-09T09:58:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。