論文の概要: Foundation Models for Credit Risk Prediction: A Game Changer?
- arxiv url: http://arxiv.org/abs/2605.18147v1
- Date: Mon, 18 May 2026 09:52:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.294056
- Title: Foundation Models for Credit Risk Prediction: A Game Changer?
- Title(参考訳): 信用リスク予測のための基礎モデル:ゲームチェンジャー?
- Authors: Bart Baesens, Andreas Goethals, Stefan Lessmann, Simon De Vos, Cristián Bravo, David Martens, Victor Medina-Olivares, Christophe Mues, Maria Oskarsdóttir, Seppe vanden Broucke, Tim Verdonck, Wouter Verbeke,
- Abstract要約: 予測モデルは信用リスク管理において重要な役割を担い、デフォルト確率と損失の正確な推定を通じて重要な決定を導く。
多様なドメインからの広範なデータセットに基づいて事前訓練されたファンデーションモデルは、事前の知識を活用することで、顕著なパフォーマンスを誇示している。
- 参考スコア(独自算出の注目度): 12.43753732401141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predictive models play a pivotal role in credit risk management, guiding critical decisions through accurate estimation of default probabilities and losses. Extensive research has introduced new modeling techniques, complemented by large-scale benchmarking studies consolidating the state-of-the-art. Today, quasi-standards such as gradient-boosting models paired with SHAP explainers have emerged, yet continuous improvement of risk models remains a top priority. Concurrently, rapid advancements in AI, most notably large language models, have disrupted predictive modeling paradigms. Foundation models, pretrained on extensive datasets from diverse domains, have demonstrated remarkable performance by leveraging prior knowledge. While prevalent in natural language processing and computer vision, foundation models for tabular data have only recently emerged. We conjecture that pretraining on out-of-domain data is particularly beneficial in small-data settings, such as SME lending or specialized corporate portfolios, and may help address longstanding challenges including low default portfolios and class imbalance. This paper benchmarks recently proposed tabular foundation models against a broad set of competitors, including established and advanced machine learning techniques, across two core tasks: PD and LGD modeling. Our evaluation encompasses various datasets, performance indicators, and experimental conditions. We find that tabular foundation models generally perform best across datasets and tasks. Moreover, they offer significant improvement in predictive performance as dataset size shrinks. These results are remarkable given that the models are tested out-of-the-box, without hyperparameter tuning, ensuring ease of use and mitigating computational costs.
- Abstract(参考訳): 予測モデルは信用リスク管理において重要な役割を担い、デフォルト確率と損失の正確な推定を通じて重要な決定を導く。
大規模な研究は、最先端技術を統合する大規模なベンチマーク研究を補完する新しいモデリング技術を導入している。
今日では、SHAP説明器と組み合わせた勾配ブースティングモデルのような準標準が出現しているが、リスクモデルの継続的な改善が最優先事項である。
同時に、AIの急速な進歩、特に大きな言語モデルが予測モデリングパラダイムを混乱させた。
多様なドメインからの広範なデータセットに基づいて事前訓練されたファンデーションモデルは、事前の知識を活用することで、顕著なパフォーマンスを誇示している。
自然言語処理やコンピュータビジョンで広く使われているが、表形式のデータの基礎モデルが最近登場したばかりである。
ドメイン外のデータの事前トレーニングは、中小企業融資や専門企業ポートフォリオなどの小規模データ設定において特に有益であり、デフォルトポートフォリオの低さやクラス不均衡といった長年にわたる課題に対処するのに役立つと推測する。
本稿は、PDとLGDモデリングという2つのコアタスクにわたる、確立された、高度な機械学習技術を含む幅広い競合相手に対して、最近提案された表形式の基礎モデルについてベンチマークする。
本評価は,各種データセット,性能指標,実験条件を含む。
表形式の基盤モデルは一般的に、データセットやタスク間で最高のパフォーマンスを達成しています。
さらに、データセットのサイズが縮小するにつれて、予測性能が大幅に向上する。
これらの結果は、ハイパーパラメータチューニング、使いやすさの確保、計算コストの軽減などなしに、モデルが最初からテストされていることを考えると、顕著である。
関連論文リスト
- On Predicting the Post-training Potential of Pre-trained LLMs [60.07459271263409]
本稿では,ポストトレーニング前のベースモデルの性能予測という,ポストトレーニング後の潜在能力を予測するための新しいタスクを紹介する。
本稿では,応答判別を活用することで,ベースモデルの生成ギャップを回避できる統一フレームワークであるRuDEを提案する。
実験では、トレーニング後のパフォーマンスと90%以上の相関を示す。
論文 参考訳(メタデータ) (2026-05-12T11:33:49Z) - Re(Visiting) Time Series Foundation Models in Finance [3.295157175236371]
金融時系列予測は、トレーディング、ポートフォリオ最適化、リスク管理の中心である。
時系列基礎モデル(TSFM)の最近の進歩は、大規模で多様なデータセットから一般化可能な時間表現を学習するための新しいパラダイムを提供する。
本稿では,グローバル金融市場におけるTSFMの総合的研究について紹介する。
論文 参考訳(メタデータ) (2025-11-23T18:44:19Z) - Class-Imbalanced-Aware Adaptive Dataset Distillation for Scalable Pretrained Model on Credit Scoring [10.737033782376905]
金融データセット上での大規模事前学習モデルの適用を拡大するための新しいフレームワークを提案する。
我々は,データセット蒸留における不均衡認識技術を統合することにより,財務データセットの性能が向上した。
論文 参考訳(メタデータ) (2025-01-18T06:59:36Z) - Low-Rank Adaptation for Foundation Models: A Comprehensive Review [56.341827242332194]
Low-Rank Adaptation (LoRA)は、これらの課題を緩和するための非常に有望なアプローチとして登場した。
この調査は、大規模な言語モデルから一般的な基礎モデルまで、LoRAテクニックの包括的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2024-12-31T09:38:55Z) - Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - KACDP: A Highly Interpretable Credit Default Prediction Model [2.776411854233918]
本稿では,KAN(Kolmogorov-Arnold Networks)に基づく手法を提案する。
Kansは学習可能なアクティベーション機能を持ち、線形重みを持たない新しいタイプのニューラルネットワークアーキテクチャである。
実験により、KACDPモデルは、パフォーマンス指標において、メインストリームの信用デフォルト予測モデルより優れていることが示された。
論文 参考訳(メタデータ) (2024-11-26T12:58:03Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。