論文の概要: The Effects of Data Imbalance Under a Federated Learning Approach for
Credit Risk Forecasting
- arxiv url: http://arxiv.org/abs/2401.07234v1
- Date: Sun, 14 Jan 2024 09:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 19:06:39.371049
- Title: The Effects of Data Imbalance Under a Federated Learning Approach for
Credit Risk Forecasting
- Title(参考訳): 信用リスク予測のためのフェデレーション学習アプローチにおけるデータ不均衡の効果
- Authors: Shuyao Zhang, Jordan Tay, Pedro Baiz
- Abstract要約: 信用リスク予測は、商業銀行や他の金融機関が顧客に融資を許可する上で重要な役割を担っている。
従来の機械学習手法では、グローバルモデルを構築するには、機密性の高いクライアント情報を外部サーバと共有する必要がある。
フェデレートラーニング(FL)として知られる、新たに開発されたプライバシ保護分散機械学習技術により、プライベートローカルデータに直接アクセスする必要なく、グローバルモデルのトレーニングが可能になる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Credit risk forecasting plays a crucial role for commercial banks and other
financial institutions in granting loans to customers and minimise the
potential loss. However, traditional machine learning methods require the
sharing of sensitive client information with an external server to build a
global model, potentially posing a risk of security threats and privacy
leakage. A newly developed privacy-preserving distributed machine learning
technique known as Federated Learning (FL) allows the training of a global
model without the necessity of accessing private local data directly. This
investigation examined the feasibility of federated learning in credit risk
assessment and showed the effects of data imbalance on model performance. Two
neural network architectures, Multilayer Perceptron (MLP) and Long Short-Term
Memory (LSTM), and one tree ensemble architecture, Extreme Gradient Boosting
(XGBoost), were explored across three different datasets under various
scenarios involving different numbers of clients and data distribution
configurations. We demonstrate that federated models consistently outperform
local models on non-dominant clients with smaller datasets. This trend is
especially pronounced in highly imbalanced data scenarios, yielding a
remarkable average improvement of 17.92% in model performance. However, for
dominant clients (clients with more data), federated models may not exhibit
superior performance, suggesting the need for special incentives for this type
of clients to encourage their participation.
- Abstract(参考訳): 信用リスク予測は、顧客へのローンの付与と損失の最小化において、商業銀行や他の金融機関にとって重要な役割を担っている。
しかしながら、従来の機械学習手法では、セキュリティ上の脅威やプライバシリークのリスクを生じさせる可能性のあるグローバルモデルを構築するために、センシティブなクライアント情報を外部サーバと共有する必要がある。
新たに開発されたプライバシー保護型分散機械学習技術であるfederated learning(fl)は、プライベートなローカルデータに直接アクセスすることなく、グローバルモデルのトレーニングを可能にする。
本研究は,信用リスク評価におけるフェデレーション学習の有効性を検証し,データ不均衡がモデル性能に及ぼす影響を示した。
多層型パーセプトロン (mlp) とlong short-term memory (lstm) の2つのニューラルネットワークアーキテクチャと、1つのツリーアンサンブルアーキテクチャであるextreme gradient boosting (xgboost) を、3つの異なるデータセットにまたがって、異なる数のクライアントとデータ分散構成を含む様々なシナリオで検討した。
フェデレーションモデルが、より小さなデータセットを持つ非支配的なクライアントのローカルモデルを上回ることを実証する。
この傾向は特に高度に不均衡なデータシナリオで顕著であり、モデルの性能が17.92%向上した。
しかし、支配的なクライアント(より多くのデータを持つクライアント)にとって、フェデレーションされたモデルは優れたパフォーマンスを示しておらず、この種のクライアントが参加を促進するための特別なインセンティブの必要性が示唆される。
関連論文リスト
- Personalized Federated Learning with Mixture of Models for Adaptive Prediction and Model Fine-Tuning [22.705411388403036]
本稿では,新しい個人化フェデレーション学習アルゴリズムを提案する。
各クライアントは、局所的に微調整されたモデルと複数のフェデレートされたモデルを組み合わせることでパーソナライズされたモデルを構築する。
実データセットに関する理論的解析と実験は、このアプローチの有効性を裏付けるものである。
論文 参考訳(メタデータ) (2024-10-28T21:20:51Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - One-Shot Federated Learning with Classifier-Guided Diffusion Models [44.604485649167216]
ワンショット・フェデレーション・ラーニング (OSFL) は, 通信コストの低さから近年注目されている。
本稿では,OSFLに拡散モデルがもたらす新たな機会を探求し,FedCADOを提案する。
FedCADOはクライアントのディストリビューションに準拠したデータを生成し、その後、サーバ上で集約されたモデルをトレーニングします。
論文 参考訳(メタデータ) (2023-11-15T11:11:25Z) - Efficient Personalized Federated Learning via Sparse Model-Adaptation [47.088124462925684]
Federated Learning (FL)は、複数のクライアントに対して、独自のプライベートデータを共有せずに機械学習モデルをトレーニングすることを目的としている。
疎局所モデルを適応的かつ効率的に学習し,効率的なパーソナライズFLのためのpFedGateを提案する。
我々は,pFedGateが最先端手法よりも優れたグローバル精度,個人精度,効率性を同時に達成できることを示す。
論文 参考訳(メタデータ) (2023-05-04T12:21:34Z) - Model Pruning Enables Localized and Efficient Federated Learning for
Yield Forecasting and Data Sharing [6.4742178124596625]
フェデレートラーニング(FL)は、アグリフード分野におけるモデルトレーニングに対する分散的なアプローチを示す。
本稿では,クライアントモデル上でのネットワークプルーニングを利用して,プルーニングされたモデルを集約する新しい技術ソリューションを提案する。
我々は大豆収量予測データセットを用いて実験を行い,FedAvgと比較して推定性能が15.5%から20%向上することが確認された。
論文 参考訳(メタデータ) (2023-04-19T17:53:43Z) - FedDM: Iterative Distribution Matching for Communication-Efficient
Federated Learning [87.08902493524556]
フェデレートラーニング(FL)は近年、学術や産業から注目を集めている。
我々は,複数の局所的代理関数からグローバルなトレーニング目標を構築するためのFedDMを提案する。
そこで本研究では,各クライアントにデータ集合を構築し,元のデータから得られた損失景観を局所的にマッチングする。
論文 参考訳(メタデータ) (2022-07-20T04:55:18Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Towards Fair Federated Learning with Zero-Shot Data Augmentation [123.37082242750866]
フェデレーション学習は重要な分散学習パラダイムとして登場し、サーバはクライアントデータにアクセスせずに、多くのクライアントがトレーニングしたモデルからグローバルモデルを集約する。
本稿では, 統計的不均一性を緩和し, フェデレートネットワークにおけるクライアント間での精度向上を図るために, ゼロショットデータ拡張を用いた新しいフェデレーション学習システムを提案する。
Fed-ZDAC (クライアントでのゼロショットデータ拡張によるフェデレーション学習) と Fed-ZDAS (サーバでのゼロショットデータ拡張によるフェデレーション学習) の2種類について検討する。
論文 参考訳(メタデータ) (2021-04-27T18:23:54Z) - Auto-weighted Robust Federated Learning with Corrupted Data Sources [7.475348174281237]
フェデレーション学習はコミュニケーション効率とプライバシ保護のトレーニングプロセスを提供する。
平均損失関数をナイーブに最小化する標準的なフェデレーション学習技術は、データの破損に弱い。
破損したデータソースに対して堅牢性を提供するために、自動重み付けロバストフェデレーテッドラーニング(arfl)を提案します。
論文 参考訳(メタデータ) (2021-01-14T21:54:55Z) - Toward Understanding the Influence of Individual Clients in Federated
Learning [52.07734799278535]
フェデレーションラーニングにより、クライアントはプライベートデータを中央サーバーに送信することなく、グローバルモデルを共同でトレーニングできます。
em-Influenceという新しい概念を定義し、パラメータに対するこの影響を定量化し、このメトリクスを推定する効果的な効率的なモデルを提案しました。
論文 参考訳(メタデータ) (2020-12-20T14:34:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。