論文の概要: A Vertical Federated Learning Method For Multi-Institutional Credit
Scoring: MICS
- arxiv url: http://arxiv.org/abs/2111.09038v1
- Date: Wed, 17 Nov 2021 11:25:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 15:03:12.392642
- Title: A Vertical Federated Learning Method For Multi-Institutional Credit
Scoring: MICS
- Title(参考訳): 多施設クレジットスコーリングのための垂直的フェデレーション学習手法:MICS
- Authors: Yusuf Efe
- Abstract要約: データプライバシの規制と異なるデータ表現の互換性の問題は、協調モデルトレーニングの大きな障害となります。
当社は、企業が自社のセクターや他の産業セクターの他の企業と協力し、顧客のプライベートデータを明示的に共有することなく、より堅牢で正確なグローバルモデルを共同でトレーニングするインセンティブがあることを示します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As more and more companies store their customers' data; various information
of a person is distributed among numerous companies' databases. Different
industrial sectors carry distinct features about the same customers. Also,
different companies within the same industrial sector carry similar kinds of
data about the customers with different data representations. Cooperation
between companies from different industrial sectors, called vertical
cooperation, and between the companies within the same sector, called
horizontal cooperation, can lead to more accurate machine learning models and
better estimations in tasks such as credit scoring. However, data privacy
regulations and compatibility issues for different data representations are
huge obstacles to cooperative model training. By proposing the training
framework MICS and experimentation on several numerical data sets, we showed
that companies would have an incentive to cooperate with other companies from
their sector and with other industrial sectors to jointly train more robust and
accurate global models without explicitly sharing their customers' private
data.
- Abstract(参考訳): ますます多くの企業が顧客のデータを保管するようになり、その人の様々な情報が多くの企業のデータベースに分散される。
異なる産業部門は、同じ顧客について異なる特徴を持っている。
また、同じ産業セクター内の異なる企業は、異なるデータ表現を持つ顧客に関する同様の種類のデータを運ぶ。
垂直協力と呼ばれる異なる産業分野の企業間の協力と、水平協力と呼ばれる同一分野の企業間の協力は、より正確な機械学習モデルと信用スコアのようなタスクにおけるより良い見積もりにつながる。
しかし、データプライバシ規制と異なるデータ表現の互換性問題は、協調モデルトレーニングの大きな障害である。
トレーニングフレームワークMICSといくつかの数値データセットを用いた実験を行うことにより、企業は、顧客個人のデータを明示的に共有することなく、より堅牢で正確なグローバルモデルを共同でトレーニングする、それぞれのセクターや他の産業セクターと協力するインセンティブを持つことが示される。
関連論文リスト
- Accelerated Stochastic ExtraGradient: Mixing Hessian and Gradient Similarity to Reduce Communication in Distributed and Federated Learning [50.382793324572845]
分散コンピューティングはデバイス間の通信を伴うため、効率性とプライバシという2つの重要な問題を解決する必要がある。
本稿では,データ類似性とクライアントサンプリングのアイデアを取り入れた新しい手法について分析する。
プライバシー問題に対処するために,付加雑音の手法を適用し,提案手法の収束への影響を解析する。
論文 参考訳(メタデータ) (2024-09-22T00:49:10Z) - Balancing Similarity and Complementarity for Federated Learning [91.65503655796603]
フェデレートラーニング(FL)は、モバイルとIoTシステムにおいてますます重要になっている。
FLの重要な課題の1つは、非i.d.データのような統計的不均一性を管理することである。
FL協調における類似性と相補性のバランスをとる新しいフレームワークである texttFedSaC を導入する。
論文 参考訳(メタデータ) (2024-05-16T08:16:19Z) - Privacy-Enhancing Collaborative Information Sharing through Federated
Learning -- A Case of the Insurance Industry [1.8092553911119764]
このレポートは、複数の保険業界データセットにまたがる単一のモデルを学ぶために、フェデレートラーニング(FL)の価値を活用する利点を実証している。
FLは、プライバシの懸念によって引き起こされる、データボリュームの制限とデータの多様性の2つに対処する。
FLの各ラウンドにおいて、コラボレータはローカルなプライベートデータを使用してモデルの改善を計算し、これらの洞察を組み合わせてグローバルなモデルを更新する。
論文 参考訳(メタデータ) (2024-02-22T21:46:24Z) - Evaluating and Incentivizing Diverse Data Contributions in Collaborative
Learning [89.21177894013225]
フェデレートされた学習モデルがうまく機能するためには、多様で代表的なデータセットを持つことが不可欠である。
データの多様性を定量化するために用いられる統計的基準と、使用するフェデレート学習アルゴリズムの選択が、結果の平衡に有意な影響を及ぼすことを示す。
我々はこれを活用して、データ収集者がグローバルな人口を代表するデータに貢献することを奨励する、シンプルな最適なフェデレーション学習機構を設計する。
論文 参考訳(メタデータ) (2023-06-08T23:38:25Z) - Strategic Data Sharing between Competitors [4.8951183832371]
このデータ共有トレードオフを分析するための一般的なフレームワークを紹介します。
経済理論から従来の市場モデルに基づくフレームワークのインスタンス化について検討する。
以上の結果から,市場環境がデータ共有インセンティブに大きく影響していることが示唆された。
論文 参考訳(メタデータ) (2023-05-25T13:34:12Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - FedDM: Iterative Distribution Matching for Communication-Efficient
Federated Learning [87.08902493524556]
フェデレートラーニング(FL)は近年、学術や産業から注目を集めている。
我々は,複数の局所的代理関数からグローバルなトレーニング目標を構築するためのFedDMを提案する。
そこで本研究では,各クライアントにデータ集合を構築し,元のデータから得られた損失景観を局所的にマッチングする。
論文 参考訳(メタデータ) (2022-07-20T04:55:18Z) - Non-IID data and Continual Learning processes in Federated Learning: A
long road ahead [58.720142291102135]
フェデレートラーニング(Federated Learning)は、複数のデバイスや機関が、データをプライベートに保存しながら、機械学習モデルを協調的にトレーニングすることを可能にする、新しいフレームワークである。
本研究では,データの統計的不均一性を正式に分類し,それに直面することのできる最も顕著な学習戦略をレビューする。
同時に、継続学習のような他の機械学習フレームワークからのアプローチを導入し、データの不均一性にも対処し、フェデレートラーニング設定に容易に適応できるようにします。
論文 参考訳(メタデータ) (2021-11-26T09:57:11Z) - Accelerating Federated Learning in Heterogeneous Data and Computational
Environments [0.7106986689736825]
本稿では,分散検証集合に対するフェデレーションにおける学習者の性能を評価する分散検証重み付け方式(DVW)を提案する。
我々は、DVWがFedAvgのような確立された手法よりも優れた性能をもたらすことを実証的に示す。
論文 参考訳(メタデータ) (2020-08-25T21:28:38Z) - Modeling Stakeholder-centric Value Chain of Data to Understand Data
Exchange Ecosystem [0.12891210250935145]
本稿では,データビジネスにおける利害関係者間の関係に着目し,利害関係者中心の価値連鎖(SVC)を記述するモデルを提案する。
SVCモデルは、データ交換エコシステムの構造的特性の分析と理解を可能にする。
論文 参考訳(メタデータ) (2020-05-22T05:04:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。