論文の概要: Private and Secure Fuzzy Name Matching
- arxiv url: http://arxiv.org/abs/2407.19979v1
- Date: Mon, 29 Jul 2024 13:11:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 13:46:37.887216
- Title: Private and Secure Fuzzy Name Matching
- Title(参考訳): プライベートおよびセキュアなファジィ名前マッチング
- Authors: Harsh Kasyap, Ugur Ilker Atmaca, Carsten Maple, Graham Cormode, Jiancong He,
- Abstract要約: ファジィな名前マッチングのための新しいプライバシ保護手法を導入する。
10kと100kの名前から1000名を探すのに約100秒と1000秒かかります。
提案手法では,クラスタリングを用いて通信オーバーヘッドを30~300倍削減する。
- 参考スコア(独自算出の注目度): 13.323602505055245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern financial institutions rely on data for many operations, including a need to drive efficiency, enhance services and prevent financial crime. Data sharing across an organisation or between institutions can facilitate rapid, evidence-based decision making, including identifying money laundering and fraud. However, data privacy regulations impose restrictions on data sharing. Privacy-enhancing technologies are being increasingly employed to allow organisations to derive shared intelligence while ensuring regulatory compliance. This paper examines the case in which regulatory restrictions mean a party cannot share data on accounts of interest with another (internal or external) party to identify people that hold an account in each dataset. We observe that the names of account holders may be recorded differently in each data set. We introduce a novel privacy-preserving approach for fuzzy name matching across institutions, employing fully homomorphic encryption with locality-sensitive hashing. The efficiency of the approach is enhanced using a clustering mechanism. The practicality and effectiveness of the proposed approach are evaluated using different datasets. Experimental results demonstrate it takes around 100 and 1000 seconds to search 1000 names from 10k and 100k names, respectively. Moreover, the proposed approach exhibits significant improvement in reducing communication overhead by 30-300 times, using clustering.
- Abstract(参考訳): 現代の金融機関は、効率性の向上、サービスの強化、金融犯罪の防止など、多くの業務のためにデータに依存している。
組織や機関間でのデータ共有は、資金洗浄や詐欺など、迅速かつ証拠に基づく意思決定を促進することができる。
しかし、データプライバシー規制はデータ共有に制限を課している。
プライバシー強化技術は、規制の遵守を確保しながら、組織が共有インテリジェンスを導出できるように、ますます採用されている。
本稿では、規制上の制約により、各データセットにアカウントを持つ人物を特定するために、当事者が利害関係者と利害関係者のデータを共有できない場合について検討する。
各データセットに、アカウント保持者の名前が異なる方法で記録される可能性があることを観察する。
本稿では, 局所性に敏感なハッシュを用いた完全同型暗号を用いて, ファジィ名前マッチングのための新しいプライバシー保護手法を提案する。
アプローチの効率はクラスタリング機構を使って向上する。
提案手法の実用性と有効性は,異なるデータセットを用いて評価する。
実験の結果、それぞれ10kと100kの名前から1000名を探すのに約100秒と1000秒かかりました。
さらに,クラスタリングにより通信オーバーヘッドを30~300倍削減する手法を提案する。
関連論文リスト
- PSA: Private Set Alignment for Secure and Collaborative Analytics on Large-Scale Data [17.23761289654492]
2社は、データインサイトを最大化するために、共通の顧客に対して、データセットを安全に参加させることを期待している。
我々はこのシナリオに対してPSAと呼ばれるソリューションを提案し、現実のユースケースに効果的に適用した。
ネットワーク帯域500Mbpsの単一スレッド上で,それぞれ100万レコードの規模で2つのデータセットを35.5秒で結合することで,提案プロトコルを異なるネットワーク条件で実装し,ベンチマークを行った。
論文 参考訳(メタデータ) (2024-10-07T04:39:14Z) - Fin-Fed-OD: Federated Outlier Detection on Financial Tabular Data [11.027356898413139]
実世界のシナリオにおける異常検出は、動的でしばしば未知の異常分布による課題を引き起こす。
本稿では、データの機密性を損なうことなく、個々の組織における異常検出を強化するという課題に対処する。
本稿では,表現学習とフェデレーション学習技術を利用して未知の異常の検出を改善する手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:22:04Z) - FewFedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning [54.26614091429253]
フェデレーション・インストラクション・チューニング(FedIT)は、複数のデータ所有者間で協調的なトレーニングを統合することで、有望なソリューションである。
FedITは、インストラクショナルデータの不足や、トレーニングデータ抽出攻撃への露出リスクなどの制限に直面している。
本稿では,FewFedPITを提案する。このFewFedPITは,フェデレートされた数ショット学習のプライバシー保護とモデル性能を同時に向上する。
論文 参考訳(メタデータ) (2024-03-10T08:41:22Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - Tight Auditing of Differentially Private Machine Learning [77.38590306275877]
プライベート機械学習では、既存の監査メカニズムは厳格である。
彼らは不確実な最悪の仮定の下でのみ厳密な見積もりを行う。
我々は、自然(逆向きではない)データセットの厳密なプライバシー推定を得られる改善された監査スキームを設計する。
論文 参考訳(メタデータ) (2023-02-15T21:40:33Z) - Fairness-aware Multi-view Clustering [41.479310583848246]
フェアネスを考慮したマルチビュークラスタリング手法FairMVCを提案する。
グループフェアネス制約を各クラスタのソフトメンバシップ割り当てに組み込んで、各クラスタ内の異なるグループの分断がデータセット全体とほぼ同じであることを保証します。
また,不均一なデータを扱う新たな正規化器を提案する。
論文 参考訳(メタデータ) (2023-02-11T21:36:42Z) - Collective Privacy Recovery: Data-sharing Coordination via Decentralized
Artificial Intelligence [2.309914459672557]
プライバシリカバリのための複雑な集合的アレンジメントの自動化とスケールアップ方法を示す。
私たちは初めて、時間的、内在的、報酬的、コーディネートされたデータ共有を比較した。
興味深いことに、データ共有のコーディネーションは、誰にとっても勝利だ。
論文 参考訳(メタデータ) (2023-01-15T01:36:46Z) - Smooth Anonymity for Sparse Graphs [69.1048938123063]
しかし、スパースデータセットを共有するという点では、差分プライバシーがプライバシのゴールドスタンダードとして浮上している。
本研究では、スムーズな$k$匿名性(スムーズな$k$匿名性)と、スムーズな$k$匿名性(スムーズな$k$匿名性)を提供する単純な大規模アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-07-13T17:09:25Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。