論文の概要: A machine learning workflow to address credit default prediction
- arxiv url: http://arxiv.org/abs/2403.03785v1
- Date: Wed, 6 Mar 2024 15:30:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 14:34:18.145653
- Title: A machine learning workflow to address credit default prediction
- Title(参考訳): クレジットデフォルト予測に対処する機械学習ワークフロー
- Authors: Rambod Rahmani, Marco Parola, and Mario G.C.A. Cimino
- Abstract要約: 信用デフォルト予測(CDP)は個人や企業の信用力を評価する上で重要な役割を果たす。
CDPを改善するためのワークフローベースのアプローチを提案する。これは、借り手が信用義務を負う確率を評価するタスクを指す。
- 参考スコア(独自算出の注目度): 0.44943951389724796
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Due to the recent increase in interest in Financial Technology (FinTech),
applications like credit default prediction (CDP) are gaining significant
industrial and academic attention. In this regard, CDP plays a crucial role in
assessing the creditworthiness of individuals and businesses, enabling lenders
to make informed decisions regarding loan approvals and risk management. In
this paper, we propose a workflow-based approach to improve CDP, which refers
to the task of assessing the probability that a borrower will default on his or
her credit obligations. The workflow consists of multiple steps, each designed
to leverage the strengths of different techniques featured in machine learning
pipelines and, thus best solve the CDP task. We employ a comprehensive and
systematic approach starting with data preprocessing using Weight of Evidence
encoding, a technique that ensures in a single-shot data scaling by removing
outliers, handling missing values, and making data uniform for models working
with different data types. Next, we train several families of learning models,
introducing ensemble techniques to build more robust models and hyperparameter
optimization via multi-objective genetic algorithms to consider both predictive
accuracy and financial aspects. Our research aims at contributing to the
FinTech industry in providing a tool to move toward more accurate and reliable
credit risk assessment, benefiting both lenders and borrowers.
- Abstract(参考訳): 近年、金融技術(FinTech)への関心が高まっているため、信用デフォルト予測(CDP)のような応用が産業や学術的な注目を集めている。
この点において、CDPは個人・企業の信用度を評価する上で重要な役割を担い、貸し手はローン承認やリスク管理に関する情報決定を行うことができる。
本稿では,借り手が信用義務を負う確率を評価する作業として,CDPを改善するワークフローベースの手法を提案する。
ワークフローは複数のステップで構成され、それぞれが機械学習パイプラインで特徴付けられるさまざまなテクニックの強みを活用するように設計されている。
我々は,エビデンスエンコーディングの重みを用いたデータプリプロセッシングから始まって,包括的かつ体系的なアプローチを採用する。この手法は,異常値の除去や値不足の処理,異なるデータ型を扱うモデルに対するデータの均一化による,単発データスケールの保証を行う。
次に,より堅牢なモデルを構築するためのアンサンブル手法と,多目的遺伝的アルゴリズムによるハイパーパラメータ最適化を導入して,予測精度と財務面の両方を考慮する。
本研究は、FinTech業界への貢献を目標とし、より正確で信頼性の高い信用リスク評価に向けたツールを提供し、貸し手と借り手の両方に恩恵を与える。
関連論文リスト
- Empowering Many, Biasing a Few: Generalist Credit Scoring through Large
Language Models [53.620827459684094]
大規模言語モデル(LLM)は、複数のタスクにまたがる強力な一般化能力を持つ信用スコアリングタスクにおいて大きな可能性を秘めている。
クレジットスコアリングのための LLM を探索する,初のオープンソース包括的フレームワークを提案する。
そこで我々は,各種金融リスク評価タスクの煩雑な要求に合わせて,指導チューニングによる最初の信用・リスク評価大言語モデル(CALM)を提案する。
論文 参考訳(メタデータ) (2023-10-01T03:50:34Z) - Financial Distress Prediction For Small And Medium Enterprises Using
Machine Learning Techniques [5.301137510638804]
ファイナンシャルディストレス予測(Financial Distress Prediction)は、失敗する構造物の数と確率を正確に予測することで、経済において重要な役割を果たす。
しかし、中小企業にとっての財政難の予測は、そのあいまいさが原因で困難である。
本稿では,金融データの薄面成分分析,コーポレートガバナンスの質,および市場交換データを関連ベクタマシンに組み込んだ企業FCPモデルを提案する。
論文 参考訳(メタデータ) (2023-02-23T15:58:30Z) - Analyzing Machine Learning Models for Credit Scoring with Explainable AI
and Optimizing Investment Decisions [0.0]
本稿では、説明可能なAI(XAI)の実践に関連する2つの異なる質問について検討する。
この研究では、単一分類器(論理回帰、決定木、LDA、QDA)、異種アンサンブル(AdaBoost、ランダムフォレスト)、シーケンシャルニューラルネットワークなど、さまざまな機械学習モデルを比較した。
LIMEとSHAPの2つの高度なポストホックモデル説明可能性技術を用いて、MLベースのクレジットスコアリングモデルを評価する。
論文 参考訳(メタデータ) (2022-09-19T21:44:42Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Recent Advances in Reinforcement Learning in Finance [3.0079490585515343]
データ量の増加による金融業界の急激な変化は、データ処理やデータ分析に関する技術に革命をもたらした。
強化学習(RL)による新たな発展は、大量の財務データをフル活用することができる。
論文 参考訳(メタデータ) (2021-12-08T19:55:26Z) - Multi Agent System for Machine Learning Under Uncertainty in Cyber
Physical Manufacturing System [78.60415450507706]
近年の予測機械学習の進歩は、製造における様々なユースケースに応用されている。
ほとんどの研究は、それに関連する不確実性に対処することなく予測精度を最大化することに焦点を当てた。
本稿では,機械学習における不確実性の原因を特定し,不確実性下での機械学習システムの成功基準を確立する。
論文 参考訳(メタデータ) (2021-07-28T10:28:05Z) - Interpretable ML-driven Strategy for Automated Trading Pattern
Extraction [2.7910505923792646]
金融時系列分析のためのボリュームベースデータ前処理手法を提案する。
手法の性能を評価するために統計的手法を用いる。
提案手法により,金融時系列パターンの分類を成功させることができた。
論文 参考訳(メタデータ) (2021-03-23T09:55:46Z) - Explanations of Machine Learning predictions: a mandatory step for its
application to Operational Processes [61.20223338508952]
信用リスクモデリングは重要な役割を果たす。
近年,機械学習や深層学習の手法が採用されている。
この分野における説明可能性問題に LIME 手法を適用することを提案する。
論文 参考訳(メタデータ) (2020-12-30T10:27:59Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。