論文の概要: Sherpa.ai Privacy-Preserving Multi-Party Entity Alignment without Intersection Disclosure for Noisy Identifiers
- arxiv url: http://arxiv.org/abs/2604.19219v1
- Date: Tue, 21 Apr 2026 08:24:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.687302
- Title: Sherpa.ai Privacy-Preserving Multi-Party Entity Alignment without Intersection Disclosure for Noisy Identifiers
- Title(参考訳): Sherpa.aiプライバシ保護によるノイズ検出のためのインターセクション開示のない多人数エンティティアライメント
- Authors: Daniel M. Jimenez-Gutierrez, Enrique Zuazua, Georgios Kellaris, Joaquin Del Rio, Oleksii Sliusarenko, Xabi Uribe-Etxebarria,
- Abstract要約: フェデレートラーニング(FL)は、生データを集中することなく、複数のパーティ間で協調的なモデルトレーニングを可能にする。
VFLトレーニングの前提条件はプライバシ保護エンティティアライメント(PPEA)である。
PPEAは、どのサンプルを共有するかを明らかにすることなく、パーティー全体(アライメント)に共通するサンプルのインデックスを確立する。
VFLのためのSherpa.aiマルチパーティPSUプロトコルを導入する。これはPPEA方式で、交差メンバシップを隠蔽し、正確かつノイズの多いマッチングを可能にする。
- 参考スコア(独自算出の注目度): 0.44333156307871574
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Federated Learning (FL) enables collaborative model training among multiple parties without centralizing raw data. There are two main paradigms in FL: Horizontal FL (HFL), where all participants share the same feature space but hold different samples, and Vertical FL (VFL), where parties possess complementary features for the same set of samples. A prerequisite for VFL training is privacy-preserving entity alignment (PPEA), which establishes a common index of samples across parties (alignment) without revealing which samples are shared between them. Conventional private set intersection (PSI) achieves alignment but leaks intersection membership, exposing sensitive relationships between datasets. The standard private set union (PSU) mitigates this risk by aligning on the union of identifiers rather than the intersection. However, existing approaches are often limited to two parties or lack support for typo-tolerant matching. In this paper, we introduce the Sherpa.ai multi-party PSU protocol for VFL, a PPEA method that hides intersection membership and enables both exact and noisy matching. The protocol generalizes two-party approaches to multiple parties with low communication overhead and offers two variants: an order-preserving version for exact alignment and an unordered version tolerant to typographical and formatting discrepancies. We prove correctness and privacy, analyze communication and computational (exponentiation) complexity, and formalize a universal index mapping from local records to a shared index space. This multi-party PSU offers a scalable, mathematically grounded protocol for PPEA in real-world VFL deployments, such as multi-institutional healthcare disease detection, collaborative risk modeling between banks and insurers, and cross-domain fraud detection between telecommunications and financial institutions, while preserving intersection privacy.
- Abstract(参考訳): フェデレートラーニング(FL)は、生データを集中することなく、複数のパーティ間で協調的なモデルトレーニングを可能にする。
FLには2つの主要なパラダイムがある: 水平FL(Horizontal FL)、すべての参加者が同じ特徴空間を共有して異なるサンプルを保持する、垂直FL(Vertical FL)。
VFLトレーニングの前提条件は、プライバシ保護エンティティアライメント(PPEA)であり、どのサンプルを共有するかを明らかにすることなく、パーティ全体(アライメント)のサンプルの共通インデックスを確立する。
従来のプライベートセット交差点(PSI)は、アライメントを実現するが、アライメントメンバシップをリークし、データセット間のセンシティブな関係を露呈する。
標準プライベート・セット・ユニオン(PSU)は、このリスクを、交差点ではなく識別子の結合に合わせることで軽減する。
しかし、既存のアプローチは2つに制限される場合もあれば、タイポトトレラントマッチングのサポートが欠如している場合も少なくない。
本稿では,VFLのためのSherpa.aiマルチパーティPSUプロトコルについて紹介する。
このプロトコルは、通信オーバーヘッドの少ない複数のパーティに対する2つのアプローチを一般化し、正確なアライメントのための順序保存バージョンと、タイポグラフィとフォーマットの相違に耐性のない非順序バージョンという2つのバリエーションを提供する。
我々は、正当性とプライバシを証明し、通信と計算の複雑さを分析し、ローカルレコードから共有インデックス空間への普遍的なインデックスマッピングを定式化する。
このマルチパーティのPSUは、実世界のVFL展開におけるPPEAのスケーラブルで数学的基盤となるプロトコルを提供する。例えば、多施設の医療疾患の検出、銀行と保険会社間の協調リスクモデリング、通信と金融機関間のクロスドメイン詐欺検出、そして交差プライバシーの保護である。
関連論文リスト
- HybridFL: A Federated Learning Approach for Financial Crime Detection [0.722756253891256]
本稿では,ハイブリッド・フェデレート・ラーニング(HybridFL)を提案する。
取引相手がトランザクションレベルの属性を持ち、複数の銀行がプライベートアカウントレベルの特徴を保有する金融犯罪検出コンテキストにおいて、HybridFLを評価する。
AMLSimとSWIFTデータセットの実験は、HybridFLがトランザクションのみのローカルモデルよりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2026-02-22T14:36:24Z) - Federated learning for unpaired multimodal data through a homogeneous transformer model [0.0]
本稿では,フェデレートされていない基礎モデルの数学的バックボーンを確立する。
これにより、グローバルモデルは、断片化、分離、プライベートデータサイロから世界の統一された表現を学ぶことができる。
論文 参考訳(メタデータ) (2026-01-25T20:30:21Z) - Perfectly-Private Analog Secure Aggregation in Federated Learning [51.61616734974475]
連合学習では、複数のパーティがモデルをローカルにトレーニングし、パラメータを中央サーバと共有する。
本稿では,有限場ではなくトーラスを用いた新しいセキュアパラメータアグリゲーション法を提案する。
論文 参考訳(メタデータ) (2025-09-10T15:22:40Z) - Proto-EVFL: Enhanced Vertical Federated Learning via Dual Prototype with Extremely Unaligned Data [28.626677790020082]
垂直連合学習(VFL)では、VFLの異なる分野にまたがるアンアライメントなサンプルは、極端にクラス不均衡である。
デュアルプロトタイプによる拡張VFLフレームワークであるProto-EVFLを提案する。
VFL における二段階最適化フレームワークである Proto-EVFL が収束速度 1/sqrt T であることを示す。
論文 参考訳(メタデータ) (2025-07-30T08:48:33Z) - FedLAP-DP: Federated Learning by Sharing Differentially Private Loss Approximations [53.268801169075836]
我々は,フェデレーション学習のための新しいプライバシ保護手法であるFedLAP-DPを提案する。
公式なプライバシー分析は、FedLAP-DPが典型的な勾配共有方式と同じプライバシーコストを発生させることを示している。
提案手法は, 通常の勾配共有法に比べて高速な収束速度を示す。
論文 参考訳(メタデータ) (2023-02-02T12:56:46Z) - Vertical Semi-Federated Learning for Efficient Online Advertising [50.18284051956359]
VFLの実践的な産業的応用を実現するために,Semi-VFL (Vertical Semi-Federated Learning) を提案する。
サンプル空間全体に適用可能な推論効率のよいシングルパーティ学生モデルを構築した。
新しい表現蒸留法は、重なり合うデータと非重なり合うデータの両方について、パーティ間の特徴相関を抽出するように設計されている。
論文 参考訳(メタデータ) (2022-09-30T17:59:27Z) - EFMVFL: An Efficient and Flexible Multi-party Vertical Federated
Learning without a Third Party [7.873139977724476]
フェデレートラーニング(Federated Learning)は、複数の参加者が、ローカルデータを開示することなく、共同でモデリングを行うことを可能にする。
EFMVFLと呼ばれるサードパーティを使わずに新しいVFLフレームワークを提案する。
私たちのフレームワークはセキュアで、より効率的で、複数の参加者に拡張が容易です。
論文 参考訳(メタデータ) (2022-01-17T07:06:21Z) - Coding for Straggler Mitigation in Federated Learning [86.98177890676077]
提案手法は,プライバシと勾配コードを保存するために1回パディングを組み合わせることで,ストラグラーに対する抵抗性を向上する。
提案手法は,MNISTデータセットとFashion-MNISTデータセットのトレーニングスピードアップ係数が6.6ドルと9.2ドルであり,それぞれ95%と85%であることを示す。
論文 参考訳(メタデータ) (2021-09-30T15:53:35Z) - Vertical Federated Learning without Revealing Intersection Membership [30.612650238615267]
Vertical Federated Learning (vFL)は、同じデータエンティティの異なる属性を持つ複数のパーティが共同でモデルをトレーニングすることを可能にする。
通常はプライベート・セット・インターセクション(PSI)によって達成される。
本稿では,PSU(Private Set Union)に基づくvFLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-10T05:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。