論文の概要: The value of text for small business default prediction: A deep learning
approach
- arxiv url: http://arxiv.org/abs/2003.08964v4
- Date: Wed, 7 Jul 2021 19:19:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 03:40:04.187507
- Title: The value of text for small business default prediction: A deep learning
approach
- Title(参考訳): 小ビジネスにおけるデフォルト予測のためのテキストの価値:ディープラーニングアプローチ
- Authors: Matthew Stevenson, Christophe Mues and Cristi\'an Bravo
- Abstract要約: 限られたデータの可用性を損なうために、融資担当者がテキストによるローン評価を提供することは、標準的な方針である。
我々は、ディープラーニングと自然言語処理の分野からの最近の進歩を活用して、貸し手が提供する60万件のテキストアセスメントから情報を抽出する。
テキストだけでは、デフォルトを予測するのに驚くほど効果的であることがわかったが、従来のデータと組み合わせると、追加の予測能力は得られない。
しかし,本提案したディープラーニングモデルは,テキストの品質に頑健であり,mSME貸出プロセスの自動化に適していると考えられる。
- 参考スコア(独自算出の注目度): 9.023847175654602
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Compared to consumer lending, Micro, Small and Medium Enterprise (mSME)
credit risk modelling is particularly challenging, as, often, the same sources
of information are not available. Therefore, it is standard policy for a loan
officer to provide a textual loan assessment to mitigate limited data
availability. In turn, this statement is analysed by a credit expert alongside
any available standard credit data. In our paper, we exploit recent advances
from the field of Deep Learning and Natural Language Processing (NLP),
including the BERT (Bidirectional Encoder Representations from Transformers)
model, to extract information from 60 000 textual assessments provided by a
lender. We consider the performance in terms of the AUC (Area Under the
receiver operating characteristic Curve) and Brier Score metrics and find that
the text alone is surprisingly effective for predicting default. However, when
combined with traditional data, it yields no additional predictive capability,
with performance dependent on the text's length. Our proposed deep learning
model does, however, appear to be robust to the quality of the text and
therefore suitable for partly automating the mSME lending process. We also
demonstrate how the content of loan assessments influences performance, leading
us to a series of recommendations on a new strategy for collecting future mSME
loan assessments.
- Abstract(参考訳): 消費者融資と比較して、マイクロ・中小企業(msme)の信用リスクモデリングは、しばしば同じ情報ソースが入手できないため、特に難しい。
したがって、限られたデータの可用性を損なうために、融資担当者がテキストによるローン評価を行うことは、標準的な方針である。
逆に、この声明は、利用可能な標準クレジットデータと並行して、信用専門家によって分析される。
本稿では, bert(bidirectional encoder representations from transformers)モデルを含む, ディープラーニングと自然言語処理(nlp)の分野における最近の進歩を活用し, 貸し手が提供する60000のテキスト評価から情報を抽出する。
本稿では,AUC(Area Under the receiver operating characteristic Curve)とBrier Scoreの測定値を用いて,テキスト単独でデフォルトの予測に驚くほど有効であることを示す。
しかし、従来のデータと組み合わせると、テキストの長さに依存するパフォーマンスで、追加の予測能力は得られない。
しかし,本提案したディープラーニングモデルは,テキストの品質に頑健であり,mSME貸出プロセスの自動化に適していると考えられる。
また、ローン評価の内容がパフォーマンスにどのように影響するかを実証し、将来のmSMEローン評価を収集するための新たな戦略に関する一連の勧告を導いた。
関連論文リスト
- Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - RepEval: Effective Text Evaluation with LLM Representation [55.26340302485898]
RepEvalは、評価のためにLarge Language Models(LLM)表現の投影を利用するメトリクスである。
我々の研究は、LLM表現に埋め込まれたテキスト品質に関する情報の豊かさを強調し、新しいメトリクスの開発のための洞察を提供する。
論文 参考訳(メタデータ) (2024-04-30T13:50:55Z) - Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文 参考訳(メタデータ) (2024-02-16T13:53:26Z) - Credit Risk Meets Large Language Models: Building a Risk Indicator from Loan Descriptions in P2P Lending [1.1970409518725493]
ピアツーピア(P2P)融資は、借り手と貸し手とをオンラインプラットフォームを通じて結びつける独特の融資メカニズムとして登場した。
しかしながら、P2P貸与は情報非対称性の課題に直面している。
本稿では,ローン申請プロセスにおいて,借主が提供したテキスト記述を活用することで,この問題に対処する新たなアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-29T10:11:05Z) - Empowering Many, Biasing a Few: Generalist Credit Scoring through Large
Language Models [53.620827459684094]
大規模言語モデル(LLM)は、複数のタスクにまたがる強力な一般化能力を持つ信用スコアリングタスクにおいて大きな可能性を秘めている。
クレジットスコアリングのための LLM を探索する,初のオープンソース包括的フレームワークを提案する。
そこで我々は,各種金融リスク評価タスクの煩雑な要求に合わせて,指導チューニングによる最初の信用・リスク評価大言語モデル(CALM)を提案する。
論文 参考訳(メタデータ) (2023-10-01T03:50:34Z) - Inclusive FinTech Lending via Contrastive Learning and Domain Adaptation [9.75150920742607]
フィンテックの貸与は、財政的包摂の促進に重要な役割を果たしてきた。
ローン審査中にアルゴリズムによる意思決定にバイアスがかかる可能性があるという懸念がある。
自己教師付きコントラスト学習とドメイン適応を用いたトランスフォーマーに基づくシーケンシャルローンスクリーニングモデルを提案する。
論文 参考訳(メタデータ) (2023-05-10T01:11:35Z) - Machine Learning Models Evaluation and Feature Importance Analysis on
NPL Dataset [0.0]
エチオピアのプライベートバンクが提供するデータセット上で、異なる機械学習モデルがどのように機能するかを評価する。
XGBoostは、KMeans SMOTEオーバーサンプリングデータ上で最高F1スコアを達成する。
論文 参考訳(メタデータ) (2022-08-28T17:09:44Z) - Explanations of Machine Learning predictions: a mandatory step for its
application to Operational Processes [61.20223338508952]
信用リスクモデリングは重要な役割を果たす。
近年,機械学習や深層学習の手法が採用されている。
この分野における説明可能性問題に LIME 手法を適用することを提案する。
論文 参考訳(メタデータ) (2020-12-30T10:27:59Z) - Super-App Behavioral Patterns in Credit Risk Models: Financial,
Statistical and Regulatory Implications [110.54266632357673]
従来の官僚データとは対照的に、アプリベースのマーケットプレースから派生した代替データが信用スコアモデルに与える影響を提示する。
2つの国にまたがって検証した結果、これらの新たなデータソースは、低体重者や若年者における金融行動を予測するのに特に有用であることが示された。
論文 参考訳(メタデータ) (2020-05-09T01:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。