論文の概要: A comparative study on machine learning models combining with outlier
detection and balanced sampling methods for credit scoring
- arxiv url: http://arxiv.org/abs/2112.13196v1
- Date: Sat, 25 Dec 2021 07:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-29 08:46:59.113525
- Title: A comparative study on machine learning models combining with outlier
detection and balanced sampling methods for credit scoring
- Title(参考訳): クレジットスコアリングのための異常検出法と平衡サンプリング法を組み合わせた機械学習モデルの比較研究
- Authors: Hongyi Qian, Shen Zhang, Baohui Wang, Lei Peng, Songfeng Gao, You Song
- Abstract要約: ピアツーピア貸与プラットフォームでは、従来の金融機関の助けを借りずにピアツーピア貸与関係を作成できる。
個人クレジットスコアリング機械学習モデルの構築は、ユーザがP2Pプラットフォームでローンを返済するかどうかを効果的に予測することができる。
各種外乱検出法と平衡サンプリング法が一般的な機械学習モデルに与える影響について検討した。
- 参考スコア(独自算出の注目度): 1.8105377206423159
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Peer-to-peer (P2P) lending platforms have grown rapidly over the past decade
as the network infrastructure has improved and the demand for personal lending
has grown. Such platforms allow users to create peer-to-peer lending
relationships without the help of traditional financial institutions. Assessing
the borrowers' credit is crucial to reduce the default rate and benign
development of P2P platforms. Building a personal credit scoring machine
learning model can effectively predict whether users will repay loans on the
P2P platform. And the handling of data outliers and sample imbalance problems
can affect the final effect of machine learning models. There have been some
studies on balanced sampling methods, but the effect of outlier detection
methods and their combination with balanced sampling methods on the
effectiveness of machine learning models has not been fully studied. In this
paper, the influence of using different outlier detection methods and balanced
sampling methods on commonly used machine learning models is investigated.
Experiments on 44,487 Lending Club samples show that proper outlier detection
can improve the effectiveness of the machine learning model, and the balanced
sampling method only has a good effect on a few machine learning models, such
as MLP.
- Abstract(参考訳): ピアツーピア(P2P)貸付プラットフォームは,ネットワークインフラの改善と個人貸付需要の増加に伴い,過去10年間で急速に成長している。
このようなプラットフォームにより、ユーザーは従来の金融機関の助けなしにピアツーピアの融資関係を作成できる。
借り手のクレジットを評価することは、デフォルトレートを下げ、p2pプラットフォームの良質な開発に不可欠である。
個人クレジットスコアリング機械学習モデルの構築は、ユーザがP2Pプラットフォームでローンを返済するかどうかを効果的に予測することができる。
そして、データ異常値の処理とサンプル不均衡問題は、機械学習モデルの最終効果に影響を与える可能性がある。
バランスドサンプリング法に関する研究がいくつかあるが、異常検出法とバランスドサンプリング法の組み合わせが機械学習モデルの有効性に与える影響は十分に研究されていない。
本稿では,汎用機械学習モデルにおける異常検出法と平衡サンプリング法の違いが与える影響について検討した。
44,487のLending Clubサンプルを用いた実験では、適切なアウトラヤ検出が機械学習モデルの有効性を向上させることが示され、バランスの取れたサンプリング手法はMLPのような機械学習モデルにのみ良い効果がある。
関連論文リスト
- Machine Unlearning in Contrastive Learning [3.6218162133579694]
本稿では,機械学習を効果的に行うためのモデルトレーニングのための,勾配制約に基づく新しいアプローチを提案する。
提案手法は,コントラスト学習モデルだけでなく,教師付き学習モデルにも有能な性能を示す。
論文 参考訳(メタデータ) (2024-05-12T16:09:01Z) - Investigating the Robustness of Counterfactual Learning to Rank Models: A Reproducibility Study [61.64685376882383]
ランク付け学習(CLTR: Counterfactual Learning to rank)は、IRコミュニティにおいて、ログ化された大量のユーザインタラクションデータを活用してランキングモデルをトレーニングする能力において、大きな注目を集めている。
本稿では,複雑かつ多様な状況における既存のCLTRモデルのロバスト性について検討する。
その結果, DLAモデルとIPS-DCMは, PS-PBMやPSSよりも, オフラインの確率推定による堅牢性が高いことがわかった。
論文 参考訳(メタデータ) (2024-04-04T10:54:38Z) - Predicting Failure of P2P Lending Platforms through Machine Learning:
The Case in China [0.0]
本研究は、特に中国でのピアツーピア(P2P)貸付プラットフォームの失敗を予測するために機械学習モデルを用いている。
この研究は、異なる選択方法とモデルにまたがる特徴部分集合に一貫して現れる頑健な変数の集合を特定する。
論文 参考訳(メタデータ) (2023-11-24T16:07:35Z) - The Effect of Balancing Methods on Model Behavior in Imbalanced
Classification Problems [4.370097023410272]
不均衡なデータは、マイノリティクラスからの学習不足によってモデルのパフォーマンスが影響を受けるため、分類において課題となる。
この研究は、バランスをとる方法のより困難な側面、すなわちモデル行動への影響に対処する。
これらの変化を捉えるために、説明可能な人工知能ツールは、バランスをとる前後にデータセットでトレーニングされたモデルを比較するために使用される。
論文 参考訳(メタデータ) (2023-06-30T22:25:01Z) - Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of
Foundation Models [103.71308117592963]
本稿ではメタラーニングと逆学習の技法を活用した自己破壊モデルの学習アルゴリズムを提案する。
小規模な実験では、MLACは、BERTスタイルのモデルが性別識別を行うために再目的化されることをほとんど防ぐことができることを示す。
論文 参考訳(メタデータ) (2022-11-27T21:43:45Z) - Analyzing Machine Learning Models for Credit Scoring with Explainable AI
and Optimizing Investment Decisions [0.0]
本稿では、説明可能なAI(XAI)の実践に関連する2つの異なる質問について検討する。
この研究では、単一分類器(論理回帰、決定木、LDA、QDA)、異種アンサンブル(AdaBoost、ランダムフォレスト)、シーケンシャルニューラルネットワークなど、さまざまな機械学習モデルを比較した。
LIMEとSHAPの2つの高度なポストホックモデル説明可能性技術を用いて、MLベースのクレジットスコアリングモデルを評価する。
論文 参考訳(メタデータ) (2022-09-19T21:44:42Z) - How robust are pre-trained models to distribution shift? [82.08946007821184]
自己教師付き学習(SSL)と自己エンコーダベースモデル(AE)の相互関係が相互関係に与える影響を示す。
本研究では, 線形ヘッドの潜在バイアスから事前学習したモデルの性能を分離するために, アウト・オブ・ディストリビューション(OOD)データに基づいて訓練された線形ヘッドを用いた新しい評価手法を開発した。
論文 参考訳(メタデータ) (2022-06-17T16:18:28Z) - FairIF: Boosting Fairness in Deep Learning via Influence Functions with
Validation Set Sensitive Attributes [51.02407217197623]
本稿では,FAIRIFという2段階の学習アルゴリズムを提案する。
サンプル重みが計算される再重み付きデータセットの損失を最小限に抑える。
FAIRIFは、様々な種類のバイアスに対して、フェアネスとユーティリティのトレードオフを良くしたモデルが得られることを示す。
論文 参考訳(メタデータ) (2022-01-15T05:14:48Z) - Model-Augmented Q-learning [112.86795579978802]
モデルベースRLの構成要素を付加したMFRLフレームワークを提案する。
具体的には、$Q$-valuesだけでなく、共有ネットワークにおける遷移と報酬の両方を見積もる。
提案手法は,MQL (Model-augmented $Q$-learning) とよばれる提案手法により,真に報いられた学習によって得られる解と同一のポリシ不変解が得られることを示す。
論文 参考訳(メタデータ) (2021-02-07T17:56:50Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Improving Robot Dual-System Motor Learning with Intrinsically Motivated
Meta-Control and Latent-Space Experience Imagination [17.356402088852423]
本稿では,メタコントローラがモデルベースとモデルフリーの判断をオンラインに調停する,新しいデュアルシステムモーター学習手法を提案する。
シミュレーションと実世界における視覚に基づくロボットグリップ学習におけるベースラインと最先端の手法に対する我々のアプローチを評価する。
論文 参考訳(メタデータ) (2020-04-19T12:14:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。