論文の概要: Machine Learning Models Evaluation and Feature Importance Analysis on
NPL Dataset
- arxiv url: http://arxiv.org/abs/2209.09638v1
- Date: Sun, 28 Aug 2022 17:09:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 17:49:14.078417
- Title: Machine Learning Models Evaluation and Feature Importance Analysis on
NPL Dataset
- Title(参考訳): NPLデータセットを用いた機械学習モデルの評価と特徴量解析
- Authors: Rufael Fekadu, Anteneh Getachew, Yishak Tadele, Nuredin Ali, Israel
Goytom
- Abstract要約: エチオピアのプライベートバンクが提供するデータセット上で、異なる機械学習モデルがどのように機能するかを評価する。
XGBoostは、KMeans SMOTEオーバーサンプリングデータ上で最高F1スコアを達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Predicting the probability of non-performing loans for individuals has a
vital and beneficial role for banks to decrease credit risk and make the right
decisions before giving the loan. The trend to make these decisions are based
on credit study and in accordance with generally accepted standards, loan
payment history, and demographic data of the clients. In this work, we evaluate
how different Machine learning models such as Random Forest, Decision tree,
KNN, SVM, and XGBoost perform on the dataset provided by a private bank in
Ethiopia. Further, motivated by this evaluation we explore different feature
selection methods to state the important features for the bank. Our findings
show that XGBoost achieves the highest F1 score on the KMeans SMOTE
over-sampled data. We also found that the most important features are the age
of the applicant, years of employment, and total income of the applicant rather
than collateral-related features in evaluating credit risk.
- Abstract(参考訳): 個人に対する非業績ローンの確率を予測することは、銀行が信用リスクを減らし、ローンを与える前に正しい決定を下す上で極めて有益である。
これらの決定を下す傾向は信用調査に基づいており、一般的に認められた基準、ローンの支払い履歴、クライアントの人口統計データに従っている。
本研究では,エチオピアのプライベートバンクが提供するデータセット上で,ランダムフォレスト,決定木,kn,svm,xgboostなどの異なる機械学習モデルがどのように動作するかを評価する。
さらに, この評価を動機として, 銀行にとって重要な特徴を記述するために, 異なる特徴選択法を検討する。
以上の結果から,XGBoostはKMeans SMOTEのオーバーサンプリングデータにおいて最高F1スコアを達成した。
また、最も重要な特徴は、信用リスクの評価において、側方関係の特徴よりも、応募者の年齢、就業年数、求職者の総収入であることがわかった。
関連論文リスト
- Deep Bayesian Active Learning for Preference Modeling in Large Language Models [84.817400962262]
本稿では,BAL-PM(Bayesian Active Learner for Preference Modeling)を提案する。
BAL-PMは2つの人気のある人間の嗜好データセットにおいて、好みラベルを33%から68%少なくし、以前のベイズ買収ポリシーを超えている。
我々の実験では、BAL-PMは2つの人気のある人選好データセットにおいて33%から68%の選好ラベルを必要としており、ベイズ買収ポリシーを上回ります。
論文 参考訳(メタデータ) (2024-06-14T13:32:43Z) - Empowering Many, Biasing a Few: Generalist Credit Scoring through Large
Language Models [53.620827459684094]
大規模言語モデル(LLM)は、複数のタスクにまたがる強力な一般化能力を持つ信用スコアリングタスクにおいて大きな可能性を秘めている。
クレジットスコアリングのための LLM を探索する,初のオープンソース包括的フレームワークを提案する。
そこで我々は,各種金融リスク評価タスクの煩雑な要求に合わせて,指導チューニングによる最初の信用・リスク評価大言語モデル(CALM)を提案する。
論文 参考訳(メタデータ) (2023-10-01T03:50:34Z) - Inclusive FinTech Lending via Contrastive Learning and Domain Adaptation [9.75150920742607]
フィンテックの貸与は、財政的包摂の促進に重要な役割を果たしてきた。
ローン審査中にアルゴリズムによる意思決定にバイアスがかかる可能性があるという懸念がある。
自己教師付きコントラスト学習とドメイン適応を用いたトランスフォーマーに基づくシーケンシャルローンスクリーニングモデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T01:11:35Z) - SF-PATE: Scalable, Fair, and Private Aggregation of Teacher Ensembles [50.90773979394264]
本稿では、個人の機密情報のプライバシーを保護しつつ、差別的でない予測者の学習を可能にするモデルについて検討する。
提案モデルの主な特徴は、プライバシ保護とフェアモデルを作成するために、オフ・ザ・セルフと非プライベートフェアモデルの採用を可能にすることである。
論文 参考訳(メタデータ) (2022-04-11T14:42:54Z) - Bagging Supervised Autoencoder Classifier for Credit Scoring [3.5977219275318166]
クレジットスコアリングデータセットの不均衡の性質と、クレジットスコアリングデータセットの特徴の不均一性は、効果的なクレジットスコアリングモデルの開発と実装に困難をもたらす。
本稿では,主にスーパービジョンオートエンコーダの性能を活かしたBaging Supervised Autoencoder (BSAC)を提案する。
BSACはまた、過半数クラスのアンサンプに基づいて、Bagingプロセスの変種を採用することで、データ不均衡の問題にも対処する。
論文 参考訳(メタデータ) (2021-08-12T17:49:08Z) - Differential Privacy for Credit Risk Model [0.0]
私たちは、プライバシー問題に対処するための解決策として、差分プライバシーを評価します。
本稿では、信用リスクモデリング分野に適用したLeapYearのそのようなツールについて評価する。
論文 参考訳(メタデータ) (2021-06-24T09:58:49Z) - Explanations of Machine Learning predictions: a mandatory step for its
application to Operational Processes [61.20223338508952]
信用リスクモデリングは重要な役割を果たす。
近年,機械学習や深層学習の手法が採用されている。
この分野における説明可能性問題に LIME 手法を適用することを提案する。
論文 参考訳(メタデータ) (2020-12-30T10:27:59Z) - PCAL: A Privacy-preserving Intelligent Credit Risk Modeling Framework
Based on Adversarial Learning [111.19576084222345]
本稿では,PCAL(Adversarial Learning)に基づくプライバシ保護型信用リスクモデリングの枠組みを提案する。
PCALは、ターゲット予測タスクのパフォーマンスの重要なユーティリティ情報を維持しながら、元のデータセット内のプライベート情報を隠蔽することを目的としている。
結果は,PCALがユーザデータから効果的なプライバシフリー表現を学習し,信用リスク分析のためのプライバシ保存機械学習の基盤となることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T07:04:59Z) - Determining Secondary Attributes for Credit Evaluation in P2P Lending [0.0]
機械学習の分類とクラスタリングアルゴリズムを用いて、借り手の信用度を正確に予測する。
キーセカンダリ属性を特定しながら,LendingClubデータ上で65%のF1と73%のAUCを達成した。
論文 参考訳(メタデータ) (2020-06-08T16:12:00Z) - Super-App Behavioral Patterns in Credit Risk Models: Financial,
Statistical and Regulatory Implications [110.54266632357673]
従来の官僚データとは対照的に、アプリベースのマーケットプレースから派生した代替データが信用スコアモデルに与える影響を提示する。
2つの国にまたがって検証した結果、これらの新たなデータソースは、低体重者や若年者における金融行動を予測するのに特に有用であることが示された。
論文 参考訳(メタデータ) (2020-05-09T01:32:03Z) - Predicting Bank Loan Default with Extreme Gradient Boosting [0.0]
ローンのデフォルト予測には、XGBoostと呼ばれるExtreme Gradient Boostingアルゴリズムを使用します。
この予測は、ローン申請と申請者の人口統計の両方のデータセットを考慮に入れた、指導的銀行からのローンデータに基づいている。
論文 参考訳(メタデータ) (2020-01-18T18:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。