論文の概要: Privacy-Preserving Feature Valuation in Vertical Federated Learning Using Shapley-CMI and PSI Permutation
- arxiv url: http://arxiv.org/abs/2512.14767v1
- Date: Tue, 16 Dec 2025 08:01:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.735882
- Title: Privacy-Preserving Feature Valuation in Vertical Federated Learning Using Shapley-CMI and PSI Permutation
- Title(参考訳): Shapley-CMI と PSI を用いた垂直的フェデレーション学習におけるプライバシー保護機能評価
- Authors: Unai Laskurain, Aitor Aguirre-Ortuzar, Urko Zurutuza,
- Abstract要約: 本稿では,垂直FL(VFL)のためのShapley-CMIのプライバシ保護実装を提案する。
生のデータ交換を必要とせずに、離散化および暗号化されたIDグループ間で暗号化された交差点サイズを計算する。
最初の実験では,提案システムの正しさとプライバシが確認された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Federated Learning (FL) is an emerging machine learning paradigm that enables multiple parties to collaboratively train models without sharing raw data, ensuring data privacy. In Vertical FL (VFL), where each party holds different features for the same users, a key challenge is to evaluate the feature contribution of each party before any model is trained, particularly in the early stages when no model exists. To address this, the Shapley-CMI method was recently proposed as a model-free, information-theoretic approach to feature valuation using Conditional Mutual Information (CMI). However, its original formulation did not provide a practical implementation capable of computing the required permutations and intersections securely. This paper presents a novel privacy-preserving implementation of Shapley-CMI for VFL. Our system introduces a private set intersection (PSI) server that performs all necessary feature permutations and computes encrypted intersection sizes across discretized and encrypted ID groups, without the need for raw data exchange. Each party then uses these intersection results to compute Shapley-CMI values, computing the marginal utility of their features. Initial experiments confirm the correctness and privacy of the proposed system, demonstrating its viability for secure and efficient feature contribution estimation in VFL. This approach ensures data confidentiality, scales across multiple parties, and enables fair data valuation without requiring the sharing of raw data or training models.
- Abstract(参考訳): Federated Learning(FL)は、複数のパーティが生データを共有せずに協力的にモデルをトレーニングし、データのプライバシを確保する、新たな機械学習パラダイムである。
同一ユーザごとに異なる機能を持つ垂直FL(VFL)では、モデルがトレーニングされる前に、特にモデルが存在しない場合の初期段階において、各モデルの特徴的貢献を評価することが重要な課題である。
これを解決するために、Shapley-CMI法は、最近、条件付き相互情報(CMI)を用いた特徴量評価に対するモデルフリーで情報理論的なアプローチとして提案されている。
しかし、元々の定式化は、必要な置換や交点を安全に計算できる実用的な実装を提供していなかった。
本稿では,VFL用Shapley-CMIの新たなプライバシ保護実装を提案する。
本システムでは, 生データ交換を必要とせずに, 必要なすべての機能置換を実行し, 離散化, 暗号化されたIDグループ間で暗号化された交差点サイズを算出する, プライベート・セット・交差点(PSI)サーバを導入している。
各パーティはこれらの交差点結果を使用してShapley-CMI値を計算し、その機能の限界効用を計算します。
最初の実験では,提案方式の正しさとプライバシを検証し,VFLの安全性と効率性の検証を行った。
このアプローチはデータの機密性を保証し、複数のパーティにわたってスケールし、生データやトレーニングモデルの共有を必要とせずに、公正なデータ評価を可能にする。
関連論文リスト
- Perfectly-Private Analog Secure Aggregation in Federated Learning [51.61616734974475]
連合学習では、複数のパーティがモデルをローカルにトレーニングし、パラメータを中央サーバと共有する。
本稿では,有限場ではなくトーラスを用いた新しいセキュアパラメータアグリゲーション法を提案する。
論文 参考訳(メタデータ) (2025-09-10T15:22:40Z) - Information-Theoretic Decentralized Secure Aggregation with Collusion Resilience [95.33295072401832]
情報理論の観点から分散型セキュアアグリゲーション(DSA)の問題点を考察する。
DSAの最小到達可能な通信量と秘密鍵率を指定する最適レート領域を特徴付ける。
本研究は,DSAの基本性能限界を確立し,信頼性の高い通信効率の高いプロトコルの設計に関する知見を提供する。
論文 参考訳(メタデータ) (2025-08-01T12:51:37Z) - QMGeo: Differentially Private Federated Learning via Stochastic Quantization with Mixed Truncated Geometric Distribution [1.565361244756411]
Federated Learning(FL)は、複数のユーザがグローバル機械学習(ML)モデルを共同でトレーニングできるフレームワークである。
このような分散フレームワークの重要な動機の1つは、ユーザにプライバシ保証を提供することである。
本稿では,DPを提供するのに必要なランダム性を導入するために,混合幾何分布を用いた新しい量子化法を提案する。
論文 参考訳(メタデータ) (2023-12-10T04:44:53Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - Differentially Private Vertical Federated Clustering [13.27934054846057]
多くのアプリケーションでは、複数のパーティが同じユーザのセットに関するプライベートデータを持っているが、非結合な属性のセットについてである。
データ対象者のプライバシーを保護しながらモデル学習を可能にするためには、垂直連合学習(VFL)技術が必要である。
本論文で提案するアルゴリズムは, 個人用垂直結合型K平均クラスタリングのための最初の実用的な解法である。
論文 参考訳(メタデータ) (2022-08-02T19:23:48Z) - Data Valuation for Vertical Federated Learning: A Model-free and
Privacy-preserving Method [14.451118953357605]
FedValueは、VFL(Vertical Federated Learning)のためのプライバシ保護、タスク固有、モデルフリーなデータ評価手法である。
まず,機械学習モデルを実行する必要なく,予測分析タスクへのデータパーティの貢献を評価する。
次に、プライバシ保存方式で各データパーティのMShapley-CMI値を算出する革新的なフェデレーション手法を開発する。
論文 参考訳(メタデータ) (2021-12-15T02:42:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。