論文の概要: Uniqueness ratio as a predictor of a privacy leakage
- arxiv url: http://arxiv.org/abs/2601.11550v1
- Date: Sun, 07 Dec 2025 20:04:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.750558
- Title: Uniqueness ratio as a predictor of a privacy leakage
- Title(参考訳): プライバシー漏洩の予測因子としての特異性比
- Authors: Danah A. AlSalem AlKhashti,
- Abstract要約: 個々のデータセットが個別に匿名化されている場合でも、独立データベースが結合されたときにアイデンティティリークが発生する可能性がある。
本研究では,再同定リスクの早期予測因子として,候補結合属性の特異性比について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identity leakage can emerge when independent databases are joined, even when each dataset is anonymized individually. While previous work focuses on post-join detection or complex privacy models, little attention has been given to simple, interpretable pre-join indicators that can warn data engineers and database administrators before integration occurs. This study investigates the uniqueness ratio of candidate join attributes as an early predictor of re-identification risk. Using synthetic multi-table datasets, we compute the uniqueness ratio of attribute combinations within each database and examine how these ratios correlate with identity exposure after the join. Experimental results show a strong relationship between high pre-join uniqueness and increased post-join leakage, measured by the proportion of records that become uniquely identifiable or fall into very small groups. Our findings demonstrate that uniqueness ratio offers an explainable and practical signal for assessing join induced privacy risk, providing a foundation for developing more comprehensive pre-join risk estimation models.
- Abstract(参考訳): 個々のデータセットが個別に匿名化されている場合でも、独立データベースが結合されたときにアイデンティティリークが発生する可能性がある。
以前の研究では、ポストジョイント検出や複雑なプライバシモデルに重点を置いていたが、統合が起こる前にデータエンジニアやデータベース管理者に警告できる、シンプルで解釈可能な事前ジョイントインジケータには、ほとんど注意が払われていない。
本研究では,再同定リスクの早期予測因子として,候補結合属性の特異性比について検討した。
合成多テーブルデータセットを用いて、各データベース内の属性組合せの特異度比を計算し、これらの比率が結合後のアイデンティティ露出とどのように相関するかを検討する。
実験結果から, 高い前接合特異性と後接合リークの増大との間には強い相関関係がみられた。
以上の結果から,一意性比は結合によるプライバシリスクを評価するための説明可能な実用的な信号であり,より包括的事前結合リスク推定モデルを構築する基盤となることが示唆された。
関連論文リスト
- Differentially private ratio statistics [0.0]
単純なアルゴリズムでさえ、プライバシー、サンプル精度、バイアスに関する優れた特性を提供できることを示す。
我々のアプローチは、差分プライバシーの文献のギャップを埋め、プライベート機械学習パイプラインにおける比率推定の実用的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-05-26T04:28:27Z) - CBW: Towards Dataset Ownership Verification for Speaker Verification via Clustering-based Backdoor Watermarking [85.68235482145091]
大規模音声データセットは貴重な知的財産となった。
本稿では,新しいデータセットのオーナシップ検証手法を提案する。
我々のアプローチはクラスタリングに基づくバックドア透かし(CBW)を導入している。
我々は,ベンチマークデータセットに対する広範な実験を行い,本手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2025-03-02T02:02:57Z) - Open-set Face Recognition with Neural Ensemble, Maximal Entropy Loss and
Feature Augmentation [1.8047694351309207]
オープンセット顔認識(Open-set Face Recognition)とは、生体認証システムが既存の全ての被験者について不完全な知識を持つシナリオを指す。
この研究は、コンパクトニューラルネットワークのアンサンブルとマージンベースのコスト関数を関連付ける新しい手法を導入する。
我々は、よく知られたLFWとIJB-Cデータセットで実験を行い、その結果、アプローチがクローズドおよびオープンセットの識別率を高めることができることを示す。
論文 参考訳(メタデータ) (2023-08-23T18:22:03Z) - Improving the Variance of Differentially Private Randomized Experiments through Clustering [16.166525280886578]
差分的プライベートなメカニズムであるCluster-DPを提案する。
より高品質なクラスタを選択することで,プライバシー保証を損なうことなく,分散ペナルティを低減できることを示す。
論文 参考訳(メタデータ) (2023-08-02T05:51:57Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - End-to-End Context-Aided Unicity Matching for Person Re-identification [100.02321122258638]
本稿では,人間同士の一致関係を学習・精査するための,エンドツーエンドの対人一意整合アーキテクチャを提案する。
サンプルのグローバルコンテキスト関係を用いて,ソフトマッチング結果を洗練し,両部グラフマッチングにより一致ユニシティに到達する。
実世界における人物再識別の応用を十分に考慮し, ワンショットとマルチショットの双方で一様マッチングを実現する。
論文 参考訳(メタデータ) (2022-10-20T07:33:57Z) - Assessing the risk of re-identification arising from an attack on
anonymised data [0.24466725954625884]
悪意のある攻撃から匿名化されたデータセットへの再識別のリスクを計算する。
そこで本研究では,k匿名化データセットにおける1人の患者の再同定の確率を推定する分析手法を提案する。
我々はこの解法を一般化し、複数の患者が再同定される確率を得る。
論文 参考訳(メタデータ) (2022-03-31T09:47:05Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - MACE: A Flexible Framework for Membership Privacy Estimation in
Generative Models [14.290199072565162]
生成モデルにおけるメンバシッププライバシ推定のための最初の公式なフレームワークを提案する。
これまでの作業と比較すると、私たちのフレームワークはより現実的で柔軟な仮定をします。
論文 参考訳(メタデータ) (2020-09-11T23:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。