論文の概要: Private and Secure Fuzzy Name Matching
- arxiv url: http://arxiv.org/abs/2407.19979v1
- Date: Mon, 29 Jul 2024 13:11:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 13:46:37.887216
- Title: Private and Secure Fuzzy Name Matching
- Title(参考訳): プライベートおよびセキュアなファジィ名前マッチング
- Authors: Harsh Kasyap, Ugur Ilker Atmaca, Carsten Maple, Graham Cormode, Jiancong He,
- Abstract要約: ファジィな名前マッチングのための新しいプライバシ保護手法を導入する。
10kと100kの名前から1000名を探すのに約100秒と1000秒かかります。
提案手法では,クラスタリングを用いて通信オーバーヘッドを30~300倍削減する。
- 参考スコア(独自算出の注目度): 13.323602505055245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern financial institutions rely on data for many operations, including a need to drive efficiency, enhance services and prevent financial crime. Data sharing across an organisation or between institutions can facilitate rapid, evidence-based decision making, including identifying money laundering and fraud. However, data privacy regulations impose restrictions on data sharing. Privacy-enhancing technologies are being increasingly employed to allow organisations to derive shared intelligence while ensuring regulatory compliance. This paper examines the case in which regulatory restrictions mean a party cannot share data on accounts of interest with another (internal or external) party to identify people that hold an account in each dataset. We observe that the names of account holders may be recorded differently in each data set. We introduce a novel privacy-preserving approach for fuzzy name matching across institutions, employing fully homomorphic encryption with locality-sensitive hashing. The efficiency of the approach is enhanced using a clustering mechanism. The practicality and effectiveness of the proposed approach are evaluated using different datasets. Experimental results demonstrate it takes around 100 and 1000 seconds to search 1000 names from 10k and 100k names, respectively. Moreover, the proposed approach exhibits significant improvement in reducing communication overhead by 30-300 times, using clustering.
- Abstract(参考訳): 現代の金融機関は、効率性の向上、サービスの強化、金融犯罪の防止など、多くの業務のためにデータに依存している。
組織や機関間でのデータ共有は、資金洗浄や詐欺など、迅速かつ証拠に基づく意思決定を促進することができる。
しかし、データプライバシー規制はデータ共有に制限を課している。
プライバシー強化技術は、規制の遵守を確保しながら、組織が共有インテリジェンスを導出できるように、ますます採用されている。
本稿では、規制上の制約により、各データセットにアカウントを持つ人物を特定するために、当事者が利害関係者と利害関係者のデータを共有できない場合について検討する。
各データセットに、アカウント保持者の名前が異なる方法で記録される可能性があることを観察する。
本稿では, 局所性に敏感なハッシュを用いた完全同型暗号を用いて, ファジィ名前マッチングのための新しいプライバシー保護手法を提案する。
アプローチの効率はクラスタリング機構を使って向上する。
提案手法の実用性と有効性は,異なるデータセットを用いて評価する。
実験の結果、それぞれ10kと100kの名前から1000名を探すのに約100秒と1000秒かかりました。
さらに,クラスタリングにより通信オーバーヘッドを30~300倍削減する手法を提案する。
関連論文リスト
- Locally Differentially Private Embedding Models in Distributed Fraud
Prevention Systems [2.001149416674759]
プライバシの観点から設計され,最近のPETs Prize Challengesで授与された不正防止のための協調的なディープラーニングフレームワークを提案する。
各種トランザクションシーケンスの潜時埋め込み表現とローカル差分プライバシを利用して、外部にホストされた不正や異常検出モデルを安全に通知するデータリリース機構を構築する。
我々は,大規模決済ネットワークが寄贈した2つの分散データセットへのコントリビューションを評価し,他のアプリケーションドメインでの公開作業に類似したユーティリティ・プライバシ・トレードオフとともに,一般的な推論時攻撃に対するロバスト性を示す。
論文 参考訳(メタデータ) (2024-01-03T14:04:18Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - Tight Auditing of Differentially Private Machine Learning [77.38590306275877]
プライベート機械学習では、既存の監査メカニズムは厳格である。
彼らは不確実な最悪の仮定の下でのみ厳密な見積もりを行う。
我々は、自然(逆向きではない)データセットの厳密なプライバシー推定を得られる改善された監査スキームを設計する。
論文 参考訳(メタデータ) (2023-02-15T21:40:33Z) - A Privacy-Preserving Hybrid Federated Learning Framework for Financial
Crime Detection [27.284477227066972]
本稿では,金融犯罪検知のためのセキュアでプライバシーに配慮した学習と推論を提供するハイブリッド・フェデレーション学習システムを提案する。
提案するフレームワークの検知性能とプライバシ保護能力を評価するために,広範な実証的研究を行った。
論文 参考訳(メタデータ) (2023-02-07T18:12:48Z) - Collective Privacy Recovery: Data-sharing Coordination via Decentralized
Artificial Intelligence [2.309914459672557]
プライバシリカバリのための複雑な集合的アレンジメントの自動化とスケールアップ方法を示す。
私たちは初めて、時間的、内在的、報酬的、コーディネートされたデータ共有を比較した。
興味深いことに、データ共有のコーディネーションは、誰にとっても勝利だ。
論文 参考訳(メタデータ) (2023-01-15T01:36:46Z) - Smooth Anonymity for Sparse Graphs [69.1048938123063]
しかし、スパースデータセットを共有するという点では、差分プライバシーがプライバシのゴールドスタンダードとして浮上している。
本研究では、スムーズな$k$匿名性(スムーズな$k$匿名性)と、スムーズな$k$匿名性(スムーズな$k$匿名性)を提供する単純な大規模アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-07-13T17:09:25Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - Second layer data governance for permissioned blockchains: the privacy
management challenge [58.720142291102135]
新型コロナウイルス(COVID-19)やエボラウイルス(エボラ出血熱)のようなパンデミックの状況では、医療データを共有することに関連する行動は、大規模な感染を避け、死亡者を減らすために重要である。
この意味において、許可されたブロックチェーン技術は、スマートコントラクトが管理する不変で統一された分散データベースを通じて、データのオーナシップ、透明性、セキュリティを提供する権利をユーザに与えるために登場します。
論文 参考訳(メタデータ) (2020-10-22T13:19:38Z) - Privacy and Data Balkanization: Circumventing the Barriers [0.0]
プライバシの懸念と法則は、異なるデータセットを共有したり、組み合わせたりする際の大きなオーバーヘッドにつながっています。
統合データの利点がまだ明確でない新しいアプリケーションでは、このオーバーヘッドは組織がデータの共有から相互に利益を得られるかどうかを判断することさえ妨げます。
我々は、データ共有のメリットがあるかどうか、許容価格を交渉する余地があるかどうかを判断するために、プライベート情報転送を利用することで、この難しさを克服する手法について議論する。
論文 参考訳(メタデータ) (2020-10-07T22:05:28Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。