論文の概要: Privacy-preserving Fuzzy Name Matching for Sharing Financial Intelligence
- arxiv url: http://arxiv.org/abs/2407.19979v2
- Date: Fri, 08 Nov 2024 12:24:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:51:48.942445
- Title: Privacy-preserving Fuzzy Name Matching for Sharing Financial Intelligence
- Title(参考訳): 金融情報共有のためのプライバシー保護ファジィ名前マッチング
- Authors: Harsh Kasyap, Ugur Ilker Atmaca, Carsten Maple, Graham Cormode, Jiancong He,
- Abstract要約: ファジィな名前マッチングのための新しいプライバシ保護方式を導入する。
それぞれ10kと100kから1000の名前を検索するのに約100秒と1000秒かかる。
通信オーバヘッドを30~300倍削減することで、大幅なパフォーマンス向上を実現している。
- 参考スコア(独自算出の注目度): 13.323602505055245
- License:
- Abstract: Financial institutions rely on data for many operations, including a need to drive efficiency, enhance services and prevent financial crime. Data sharing across an organisation or between institutions can facilitate rapid, evidence-based decision-making, including identifying money laundering and fraud. However, modern data privacy regulations impose restrictions on data sharing. For this reason, privacy-enhancing technologies are being increasingly employed to allow organisations to derive shared intelligence while ensuring regulatory compliance. This paper examines the case in which regulatory restrictions mean a party cannot share data on accounts of interest with another (internal or external) party to determine individuals that hold accounts in both datasets. The names of account holders may be recorded differently in each dataset. We introduce a novel privacy-preserving scheme for fuzzy name matching across institutions, employing fully homomorphic encryption over MinHash signatures. The efficiency of the proposed scheme is enhanced using a clustering mechanism. Our scheme ensures privacy by only revealing the possibility of a potential match to the querying party. The practicality and effectiveness are evaluated using different datasets, and compared against state-of-the-art schemes. It takes around 100 and 1000 seconds to search 1000 names from 10k and 100k names, respectively, meeting the requirements of financial institutions. Furthermore, it exhibits significant performance improvement in reducing communication overhead by 30-300 times.
- Abstract(参考訳): 金融機関は、効率性の向上、サービス強化、金融犯罪防止など、多くの業務のためにデータに依存している。
組織や機関間でのデータ共有は、資金洗浄や詐欺など、迅速かつ証拠に基づく意思決定を促進することができる。
しかし、現代のデータプライバシー規制はデータ共有に制限を課している。
このため、規制の遵守を確保しつつ、共有されたインテリジェンスを導出できるように、プライバシ強化技術がますます採用されている。
本稿では、規制上の制約により、当事者が利害関係者と利害関係者(内部または外部)とデータを共有できず、双方のデータセットに口座を持つ個人を特定できない場合について検討する。
アカウント保持者の名はデータセットごとに異なる記録をすることができる。
我々は,MinHashシグネチャに対する完全同型暗号化を利用して,ファジィ名前マッチングのための新しいプライバシ保護方式を導入する。
提案手法の効率はクラスタリング機構を用いて向上する。
当社の手法は,クエリ相手にマッチする可能性のみを明らかにすることで,プライバシを確保する。
実用性と有効性は、異なるデータセットを用いて評価され、最先端のスキームと比較される。
金融機関の要件を満たすために、それぞれ10kと100kから1000の名前を検索するのに約100秒と1000秒かかる。
さらに、通信オーバヘッドを30~300倍削減することで、大幅な性能向上を実現している。
関連論文リスト
- PSA: Private Set Alignment for Secure and Collaborative Analytics on Large-Scale Data [17.23761289654492]
2社は、データインサイトを最大化するために、共通の顧客に対して、データセットを安全に参加させることを期待している。
我々はこのシナリオに対してPSAと呼ばれるソリューションを提案し、現実のユースケースに効果的に適用した。
ネットワーク帯域500Mbpsの単一スレッド上で,それぞれ100万レコードの規模で2つのデータセットを35.5秒で結合することで,提案プロトコルを異なるネットワーク条件で実装し,ベンチマークを行った。
論文 参考訳(メタデータ) (2024-10-07T04:39:14Z) - Fin-Fed-OD: Federated Outlier Detection on Financial Tabular Data [11.027356898413139]
実世界のシナリオにおける異常検出は、動的でしばしば未知の異常分布による課題を引き起こす。
本稿では、データの機密性を損なうことなく、個々の組織における異常検出を強化するという課題に対処する。
本稿では,表現学習とフェデレーション学習技術を利用して未知の異常の検出を改善する手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:22:04Z) - FewFedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning [54.26614091429253]
フェデレーション・インストラクション・チューニング(FedIT)は、複数のデータ所有者間で協調的なトレーニングを統合することで、有望なソリューションである。
FedITは、インストラクショナルデータの不足や、トレーニングデータ抽出攻撃への露出リスクなどの制限に直面している。
本稿では,FewFedPITを提案する。このFewFedPITは,フェデレートされた数ショット学習のプライバシー保護とモデル性能を同時に向上する。
論文 参考訳(メタデータ) (2024-03-10T08:41:22Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - Tight Auditing of Differentially Private Machine Learning [77.38590306275877]
プライベート機械学習では、既存の監査メカニズムは厳格である。
彼らは不確実な最悪の仮定の下でのみ厳密な見積もりを行う。
我々は、自然(逆向きではない)データセットの厳密なプライバシー推定を得られる改善された監査スキームを設計する。
論文 参考訳(メタデータ) (2023-02-15T21:40:33Z) - Fairness-aware Multi-view Clustering [41.479310583848246]
フェアネスを考慮したマルチビュークラスタリング手法FairMVCを提案する。
グループフェアネス制約を各クラスタのソフトメンバシップ割り当てに組み込んで、各クラスタ内の異なるグループの分断がデータセット全体とほぼ同じであることを保証します。
また,不均一なデータを扱う新たな正規化器を提案する。
論文 参考訳(メタデータ) (2023-02-11T21:36:42Z) - Collective Privacy Recovery: Data-sharing Coordination via Decentralized
Artificial Intelligence [2.309914459672557]
プライバシリカバリのための複雑な集合的アレンジメントの自動化とスケールアップ方法を示す。
私たちは初めて、時間的、内在的、報酬的、コーディネートされたデータ共有を比較した。
興味深いことに、データ共有のコーディネーションは、誰にとっても勝利だ。
論文 参考訳(メタデータ) (2023-01-15T01:36:46Z) - Smooth Anonymity for Sparse Graphs [69.1048938123063]
しかし、スパースデータセットを共有するという点では、差分プライバシーがプライバシのゴールドスタンダードとして浮上している。
本研究では、スムーズな$k$匿名性(スムーズな$k$匿名性)と、スムーズな$k$匿名性(スムーズな$k$匿名性)を提供する単純な大規模アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-07-13T17:09:25Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。