論文の概要: Mobile Phone Usage Data for Credit Scoring
- arxiv url: http://arxiv.org/abs/2002.12616v1
- Date: Fri, 28 Feb 2020 09:32:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 08:00:27.501400
- Title: Mobile Phone Usage Data for Credit Scoring
- Title(参考訳): 信用スコアのための携帯電話利用データ
- Authors: Henri Ots, Innar Liiv, and Diana Tur
- Abstract要約: 私たちは、異なる分類アルゴリズムを使用して、顧客をモバイルデータを使用して支払いと非支払いに分割します。
2,503人の顧客のみに基づくモバイルデータからなるデータセットでは、信用リスクを予測できることがわかった。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of this study is to demostrate that mobile phone usage data can be
used to make predictions and find the best classification method for credit
scoring even if the dataset is small (2,503 customers). We use different
classification algorithms to split customers into paying and non-paying ones
using mobile data, and then compare the predicted results with actual results.
There are several related works publicly accessible in which mobile data has
been used for credit scoring, but they are all based on a large dataset. Small
companies are unable to use datasets as large as those used by these related
papers, therefore these studies are of little use for them. In this paper we
try to argue that there is value in mobile phone usage data for credit scoring
even if the dataset is small. We found that with a dataset that consists of
mobile data based only on 2,503 customers, we can predict credit risk. The best
classification method gave us the result 0.62 AUC (area under the curve).
- Abstract(参考訳): 本研究の目的は、携帯電話の利用データを用いて予測を行い、データセットが小さい(2,503顧客)場合でも、クレジットスコアの最良の分類方法を見つけることである。
我々は、異なる分類アルゴリズムを使用して、顧客をモバイルデータを使って支払いと非支払いに分割し、予測結果と実際の結果を比較する。
クレジットスコアリングにモバイルデータが使用されている関連作品がいくつかあるが、いずれも大規模なデータセットに基づいている。
小企業は、これらの関連論文で使われているものほどデータセットを使用できないため、これらの研究はほとんど役に立たない。
本稿では,たとえデータセットが小さい場合でも,クレジットスコアリングに携帯電話の利用データに価値があることを論じる。
2,503人の顧客のみに基づくモバイルデータからなるデータセットでは、信用リスクを予測できることがわかった。
最良の分類法は、0.62 AUC(曲線下)の結果を得た。
関連論文リスト
- Data Distribution Valuation [56.71023681599737]
既存のデータバリュエーションメソッドは、離散データセットの値を定義します。
多くのユースケースでは、ユーザはデータセットの値だけでなく、データセットがサンプリングされた分布の値にも興味を持っています。
本稿では,理論的原理と実行可能なポリシを実現するための,MMDに基づく評価手法を提案する。
論文 参考訳(メタデータ) (2024-10-06T07:56:53Z) - Scaling Laws for the Value of Individual Data Points in Machine Learning [55.596413470429475]
個々のデータポイントの値のスケーリング行動を調べることによって、新しい視点を導入する。
スケーリング法則を支持するための学習理論を提供し、それが様々なモデルクラスにまたがっていることを実証的に観察する。
私たちの研究は、個々のデータポイントの値のスケーリング特性を理解し、活用するための第一歩です。
論文 参考訳(メタデータ) (2024-05-30T20:10:24Z) - Combining Public Human Activity Recognition Datasets to Mitigate Labeled
Data Scarcity [1.274578243851308]
本稿では,一般公開されたデータセットと一般化されたHARモデルを学習するための新たな戦略を提案する。
我々の実験評価は、さまざまな最先端ニューラルネットワークアーキテクチャの実験を含むもので、公開データセットを組み合わせることで、ラベル付きサンプルの数を著しく削減できることを示している。
論文 参考訳(メタデータ) (2023-06-23T18:51:22Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Data-OOB: Out-of-bag Estimate as a Simple and Efficient Data Value [17.340091573913316]
本研究では,バッジモデルのためのデータ評価手法であるData-OOBを提案する。
Data-OOBは、評価に106ドルのサンプルがあり、入力寸法が100である場合、1つのCPUプロセッサで2.25時間未満である。
提案手法は,誤ラベル付きデータを識別し,有用な(あるいは有害な)データポイントの集合を見出すことで,既存の最先端データ評価手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2023-04-16T08:03:58Z) - Feature-Level Fusion of Super-App and Telecommunication Alternative Data
Sources for Credit Card Fraud Detection [106.33204064461802]
クレジットカード不正を早期に検出するための,スーパーアプリ顧客情報,携帯電話回線データ,従来型の信用リスク変数を融合した機能レベルの有効性について検討する。
クレジットカードのデジタルプラットフォームデータベースから約9万人のユーザを対象に,我々のアプローチを評価した。
論文 参考訳(メタデータ) (2021-11-05T19:10:35Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z) - The Value of Big Data for Credit Scoring: Enhancing Financial Inclusion
using Mobile Phone Data and Social Network Analytics [6.919243767837341]
本稿では、統計モデルと経済モデルの両方のパフォーマンスを向上させるために、代替データソースを活用する。
顧客のコール・ディテール・レコード、クレジット・アンド・デビット・アカウント情報を含むデータセットのユニークな組み合わせが使用される。
結果は、コール・ディテール・レコードの倫理的利用、規制の影響、財務的包括性、データ共有とプライバシーに影響を及ぼす。
論文 参考訳(メタデータ) (2020-02-23T16:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。