論文の概要: DNN2LR: Automatic Feature Crossing for Credit Scoring
- arxiv url: http://arxiv.org/abs/2102.12036v1
- Date: Wed, 24 Feb 2021 02:36:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 15:04:12.550858
- Title: DNN2LR: Automatic Feature Crossing for Credit Scoring
- Title(参考訳): DNN2LR:クレジットスコアリングの自動機能クロス
- Authors: Qiang Liu, Zhaocheng Liu, Haoli Zhang, Yuntian Chen, Jun Zhu
- Abstract要約: クレジットスコアリングは、金融機関がクレジットローンを承認するか拒否するかを決めるための機械学習の大きな応用である。
信頼性のためには、信用スコアモデルが正確かつグローバルに解釈可能である必要がある。
単純な分類器、例えばロジスティック回帰(LR)はホワイトボックスモデルであるが、機能間の複雑な非線形相互作用をモデル化するほど強力ではない。
- 参考スコア(独自算出の注目度): 29.429167381455684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Credit scoring is a major application of machine learning for financial
institutions to decide whether to approve or reject a credit loan. For sake of
reliability, it is necessary for credit scoring models to be both accurate and
globally interpretable. Simple classifiers, e.g., Logistic Regression (LR), are
white-box models, but not powerful enough to model complex nonlinear
interactions among features. Fortunately, automatic feature crossing is a
promising way to find cross features to make simple classifiers to be more
accurate without heavy handcrafted feature engineering. However, credit scoring
is usually based on different aspects of users, and the data usually contains
hundreds of feature fields. This makes existing automatic feature crossing
methods not efficient for credit scoring. In this work, we find local
piece-wise interpretations in Deep Neural Networks (DNNs) of a specific feature
are usually inconsistent in different samples, which is caused by feature
interactions in the hidden layers. Accordingly, we can design an automatic
feature crossing method to find feature interactions in DNN, and use them as
cross features in LR. We give definition of the interpretation inconsistency in
DNN, based on which a novel feature crossing method for credit scoring
prediction called DNN2LR is proposed. Apparently, the final model, i.e., a LR
model empowered with cross features, generated by DNN2LR is a white-box model.
Extensive experiments have been conducted on both public and business datasets
from real-world credit scoring applications. Experimental shows that, DNN2LR
can outperform the DNN model, as well as several feature crossing methods.
Moreover, comparing with the state-of-the-art feature crossing methods, i.e.,
AutoCross, DNN2LR can accelerate the speed for feature crossing by about 10 to
40 times on datasets with large numbers of feature fields.
- Abstract(参考訳): クレジットスコアリングは、金融機関がクレジットローンを承認するか拒否するかを決めるための機械学習の大きな応用である。
信頼性のためには、信用スコアモデルが正確かつグローバルに解釈可能である必要がある。
単純な分類器、例えばロジスティック回帰(LR)はホワイトボックスモデルであるが、機能間の複雑な非線形相互作用をモデル化するほど強力ではない。
幸いなことに、自動機能横断は、重い手作業による機能エンジニアリングなしに、単純な分類器をより正確にするクロス機能を見つけるための有望な方法です。
しかし、クレジットスコアは通常ユーザーの異なる側面に基づいており、データはたいてい数百の機能フィールドを含んでいる。
これにより、既存の自動機能横断方式はクレジットスコアリングには適さない。
この研究では、特定の特徴のDeep Neural Networks(DNN)の局所的な部分的解釈が、通常、異なるサンプルでは矛盾しており、これは隠れた層における特徴相互作用によって引き起こされる。
したがって、DNNで機能間相互作用を見つけるための自動機能横断法を設計し、LRのクロス機能として使うことができる。
DNN2LRと呼ばれる信用スコアリング予測のための新しい特徴の交差方法が提案されたDNNにおける解釈の不整合の定義を与える。
明らかに、DNN2LRによって生成されたクロス機能を備えたLRモデルである最終モデルは、ホワイトボックスモデルである。
実世界のクレジットスコアアプリケーションから、パブリックデータセットとビジネスデータセットの両方で広範な実験が行われた。
実験的には、DNN2LRはDNNモデルといくつかの機能横断法を上回ることができる。
さらに,最新の機能横断手法であるAutoCrossと比較して,DNN2LRは,多数の機能フィールドを持つデータセット上で,機能横断の速度を約10~40倍に向上させることができる。
関連論文リスト
- DiffGAN: A Test Generation Approach for Differential Testing of Deep Neural Networks [0.30292136896203486]
DiffGANはディープニューラルネットワーク(DNN)の差分テストのためのブラックボックステスト画像生成手法である
それは多様で有効なトリガー入力を生成し、モデル間の振る舞いの相違を明らかにする。
その結果、DiffGANはSOTAベースラインを著しく上回り、同じ予算内で4倍のインプットをトリガーし、多様性と妥当性が向上した。
論文 参考訳(メタデータ) (2024-10-15T23:49:01Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - DNNR: Differential Nearest Neighbors Regression [8.667550264279166]
K-nearest neighbors(KNN)は、機械学習において最も早く、最も確立されたアルゴリズムの1つである。
回帰タスクでは、KNNは、多くの課題を引き起こす地区内のターゲットを平均化する。
両問題に同時に対処するDNNR(differial Nearest Neighbors Regression)を提案する。
論文 参考訳(メタデータ) (2022-05-17T15:22:53Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - DNN2LR: Interpretation-inspired Feature Crossing for Real-world Tabular
Data [8.263759079040108]
ロジスティック回帰(LR)は世界規模で解釈可能であるが、複雑な非線形相互作用をモデル化するほど強力ではない。
ディープニューラルネットワーク(DNN)は、データモデリングに非常に有効であるが、世界規模では解釈できない。
本研究では, 特定の特徴のDNNにおける局所的な部分的解釈は, 通常, 異なるサンプルにおいて矛盾する。
そこで我々は,DNNにおける特徴の相互作用を見つけるための自動的特徴交差法を提案し,それをLRの横断的特徴として利用する。
論文 参考訳(メタデータ) (2020-08-22T08:03:15Z) - Associating Multi-Scale Receptive Fields for Fine-grained Recognition [5.079292308180334]
マルチスケールの受容場を2つの操作で関連付けるために,新しい多層非局所(CNL)モジュールを提案する。
CNLはクエリ層とすべてのレスポンス層の間の相関を計算する。
モデルでは,多層層間の空間的依存関係を構築し,より識別的な特徴を学習する。
論文 参考訳(メタデータ) (2020-05-19T01:16:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。