論文の概要: CVPL: A Geometric Framework for Post-Hoc Linkage Risk Assessment in Protected Tabular Data
- arxiv url: http://arxiv.org/abs/2602.11015v1
- Date: Wed, 11 Feb 2026 16:39:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:02.191348
- Title: CVPL: A Geometric Framework for Post-Hoc Linkage Risk Assessment in Protected Tabular Data
- Title(参考訳): CVPL:保護されたタブラリデータにおけるホック後リンクリスク評価のための幾何学的フレームワーク
- Authors: Valery Khvatov, Alexey Neyman,
- Abstract要約: 形式的なプライバシメトリクスはコンプライアンス指向の保証を提供するが、リリースされたデータセットにおける実際のリンク可能性の定量化に失敗することが多い。
CVPLは、ブロッキング、ベクトル化、潜在射影、類似性評価を含む演算子パイプラインとしてリンク解析を表現している。
19の構成にまたがる10,000レコードの実証的検証は、正式なk匿名性コンプライアンスが経験的結合性と共存することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Formal privacy metrics provide compliance-oriented guarantees but often fail to quantify actual linkability in released datasets. We introduce CVPL (Cluster-Vector-Projection Linkage), a geometric framework for post-hoc assessment of linkage risk between original and protected tabular data. CVPL represents linkage analysis as an operator pipeline comprising blocking, vectorization, latent projection, and similarity evaluation, yielding continuous, scenario-dependent risk estimates rather than binary compliance verdicts. We formally define CVPL under an explicit threat model and introduce threshold-aware risk surfaces, R(lambda, tau), that capture the joint effects of protection strength and attacker strictness. We establish a progressive blocking strategy with monotonicity guarantees, enabling anytime risk estimation with valid lower bounds. We demonstrate that the classical Fellegi-Sunter linkage emerges as a special case of CVPL under restrictive assumptions, and that violations of these assumptions can lead to systematic over-linking bias. Empirical validation on 10,000 records across 19 protection configurations demonstrates that formal k-anonymity compliance may coexist with substantial empirical linkability, with a significant portion arising from non-quasi-identifier behavioral patterns. CVPL provides interpretable diagnostics identifying which features drive linkage feasibility, supporting privacy impact assessment, protection mechanism comparison, and utility-risk trade-off analysis.
- Abstract(参考訳): 形式的なプライバシメトリクスはコンプライアンス指向の保証を提供するが、リリースされたデータセットにおける実際のリンク可能性の定量化に失敗することが多い。
CVPL(Cluster-Vector-Projection Linkage)は,元と保護された表データ間のリンクリスクを評価するための幾何学的フレームワークである。
CVPLは、ブロッキング、ベクトル化、潜在射影、類似性評価を含む演算子パイプラインとしてリンケージ解析を表現し、バイナリコンプライアンスの検証よりも連続的でシナリオに依存したリスク見積を生成する。
CVPLを明示的な脅威モデルで定義し、保護強度と攻撃厳密性の合同効果を捉える閾値認識型リスクサーフェスR(lambda, tau)を導入する。
我々は、モノトニック性を保証するプログレッシブブロッキング戦略を確立し、有効な下限によるリスク推定を可能にする。
我々は,古典的なFellegi-Sunter結合が制限的な仮定の下でCVPLの特別な場合として現れ,これらの仮定の違反が体系的なオーバーリンクバイアスを引き起こすことを実証した。
19の保護構成にまたがる10,000レコードの実証検証では、形式的なk匿名性コンプライアンスは、擬似識別しない行動パターンから生じる重要な部分を含む、かなりの経験的結合性と共存する可能性があることが示されている。
CVPLは、どの機能がリンクの実現可能性を促進するか、プライバシ影響評価のサポート、保護メカニズムの比較、ユーティリティリスクのトレードオフ分析を識別する解釈可能な診断を提供する。
関連論文リスト
- RAPID: Risk of Attribute Prediction-Induced Disclosure in Synthetic Microdata [0.0]
本稿では,現実的な攻撃モデル下での推論的脆弱性を直接定量化する情報開示リスク尺度を提案する。
敵は、解放された合成データのみに基づいて予測モデルを訓練し、実際の個人の擬似識別器に適用する。
本報告では,攻撃者が真のクラスに対してどの程度の自信を持っているかを評価するためのベースライン正規化信頼度スコアを提案する。
論文 参考訳(メタデータ) (2026-02-09T22:03:11Z) - Prediction-Powered Risk Monitoring of Deployed Models for Detecting Harmful Distribution Shifts [51.37000123503367]
予測駆動型リスクモニタリング(PPRM)を提案する。
PPRMは、合成ラベルを真のラベルの小さなセットと組み合わせることで、ランニングリスクの任意の有意な下界を構築する。
本稿では,画像分類,大規模言語モデル(LLM),通信監視タスクの広範な実験を通じて,PPRMの有効性を実証する。
論文 参考訳(メタデータ) (2026-02-02T15:32:14Z) - Quantifying the Risk of Transferred Black Box Attacks [0.0]
ニューラルネットワークは、セキュリティ関連製品など、さまざまなアプリケーションに広く普及している。
本稿では,移動攻撃に対するレジリエンステストの複雑さについて検討する。
本稿では,CKA(Centered Kernel Alignment)の類似性に基づいて戦略的に選択された代理モデルを用いたレジリエンステストフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-07T09:34:43Z) - Unifying Re-Identification, Attribute Inference, and Data Reconstruction Risks in Differential Privacy [24.723577119566112]
攻撃成功のバウンダリは、再識別、属性推論、データ再構成リスクにまたがって、同一の統一形式をとることができることを示す。
この結果は, $varepsilon$-DP, R'enyi DP, および集中DPを用いた従来の方法よりも厳密である。
論文 参考訳(メタデータ) (2025-07-09T15:59:30Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Verification-Guided Falsification for Safe RL via Explainable Abstraction and Risk-Aware Exploration [8.246285288584625]
本稿では、説明可能性、モデルチェック、リスク誘導のファルシフィケーションを統合し、厳密性とカバレッジを両立させるハイブリッドフレームワークを提案する。
我々のアプローチは、包括的抽象ポリシー要約(CAPS)を用いたRLポリシーの人間解釈可能な抽象化の構築から始まる。
違反が検出されない場合、オフラインデータセットの抽象化とカバレッジに制限があるため、満足度を結論付けることはできません。
論文 参考訳(メタデータ) (2025-06-04T00:54:01Z) - Conditional Conformal Risk Adaptation [9.559062601251464]
セグメンテーションタスクの条件付きリスク制御を大幅に改善する適応予測セットを作成するための新しいスコア関数を開発する。
画素単位での包含推定の信頼性を高めるための特殊確率校正フレームワークを提案する。
ポリープセグメンテーション実験により, 3つの手法が有意な限界リスク制御を提供し, より一貫した条件リスク制御を実現することを示した。
論文 参考訳(メタデータ) (2025-04-10T10:01:06Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。