論文の概要: NCorr-FP: A Neighbourhood-based Correlation-preserving Fingerprinting Scheme for Intellectual Property Protection of Structured Data
- arxiv url: http://arxiv.org/abs/2505.06379v1
- Date: Fri, 09 May 2025 18:53:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.816023
- Title: NCorr-FP: A Neighbourhood-based Correlation-preserving Fingerprinting Scheme for Intellectual Property Protection of Structured Data
- Title(参考訳): NCorr-FP:構造化データの知的財産保護のための隣接型相関保存フィンガープリント方式
- Authors: Tanja Šarčević, Andreas Rauber, Rudolf Mayer,
- Abstract要約: NCorr-FPは近隣の相関保存フィンガープリントシステムである。
指紋は, 埋め込み比が高い場合でも, 微小ヘリンジャー距離とKLの発散がほとんど認められないことが確認できた。
本手法は,データ削除による検出信頼度を100%達成し,適応攻撃や衝突攻撃に対して頑健に維持する。
- 参考スコア(独自算出の注目度): 0.294944680995069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring data ownership and traceability of unauthorised redistribution are central to safeguarding intellectual property in shared data environments. Data fingerprinting addresses these challenges by embedding recipient-specific marks into the data, typically via content modifications. We propose NCorr-FP, a Neighbourhood-based Correlation-preserving Fingerprinting system for structured tabular data with the main goal of preserving statistical fidelity. The method uses local record similarity and density estimation to guide the insertion of fingerprint bits. The embedding logic is then reversed to extract the fingerprint from a potentially modified dataset. Extensive experiments confirm its effectiveness, fidelity, utility and robustness. Results show that fingerprints are virtually imperceptible, with minute Hellinger distances and KL divergences, even at high embedding ratios. The system also maintains high data utility for downstream predictive tasks. The method achieves 100\% detection confidence under substantial data deletions and remains robust against adaptive and collusion attacks. Satisfying all these requirements concurrently on mixed-type datasets highlights the strong applicability of NCorr-FP to real-world data settings.
- Abstract(参考訳): 権限のない再配布のデータの所有権とトレーサビリティを保証することは、共有データ環境における知的財産の保護の中心である。
データフィンガープリントは、典型的にはコンテンツ修正を通じて、受信者固有のマークをデータに埋め込むことによって、これらの課題に対処する。
そこで我々は,NCorr-FPを提案する。NCorr-FP,NCorr-FP,Neighbourhood-based correlation-serving Fingerprinting system for structured tabular data with the main goal toserving statistics fidelity。
この方法は、局所記録類似度と密度推定を用いて指紋ビットの挿入を誘導する。
埋め込みロジックは反転して、潜在的に修正されたデータセットから指紋を抽出する。
大規模な実験により、その有効性、忠実性、実用性、堅牢性が確認されている。
その結果, 指紋は, 高埋め込み比においても, 微小ヘリンジャー距離とKLの発散がほとんど認められないことが判明した。
システムは下流予測タスクのための高データユーティリティも維持する。
本手法は,データ削除による検出信頼度100\%を実現し,アダプティブアタックやコラシオンアタックに対して頑健である。
混合型データセットでこれらすべての要件を同時に満たすことで、NCorr-FPが現実世界のデータ設定に強く適用可能であることが強調される。
関連論文リスト
- CBW: Towards Dataset Ownership Verification for Speaker Verification via Clustering-based Backdoor Watermarking [85.68235482145091]
大規模音声データセットは貴重な知的財産となった。
本稿では,新しいデータセットのオーナシップ検証手法を提案する。
我々のアプローチはクラスタリングに基づくバックドア透かし(CBW)を導入している。
我々は,ベンチマークデータセットに対する広範な実験を行い,本手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2025-03-02T02:02:57Z) - Contrastive Learning-Based privacy metrics in Tabular Synthetic Datasets [40.67424997797513]
合成データは、医療や金融などの分野におけるプライバシー強化技術(PET)として注目されている。
類似度に基づく手法は、トレーニングと合成データとの類似度のレベルを求めることを目的としている。
攻撃に基づく手法は、合成データセットに対する故意の攻撃を誘発する。
論文 参考訳(メタデータ) (2025-02-19T15:52:23Z) - FedDW: Distilling Weights through Consistency Optimization in Heterogeneous Federated Learning [14.477559543490242]
Federated Learning(FL)は、データの集中化なしにデバイス間でのニューラルネットワークトレーニングを可能にする、革新的な分散機械学習パラダイムである。
従来の研究では、IID環境では、モデルのパラメータ構造が特定の一貫性の原則に従うことが期待されている。
本稿では,両者の整合性を識別し,FedDWフレームワークの基盤となるトレーニングの調整に活用する。
実験結果から,FedDWは10種類の最先端FL法より優れ,高度不均一条件下では平均3%精度が向上した。
論文 参考訳(メタデータ) (2024-12-05T12:32:40Z) - Data Plagiarism Index: Characterizing the Privacy Risk of Data-Copying in Tabular Generative Models [9.784347635082232]
本稿では,データプラジャリズム指標(Data Plagiarism Index)と呼ばれる新しい類似度指標とメンバーシップ推論攻撃を提案する。
DPIはデータコピーの直感的な定義を評価し,それに対応するプライバシリスクを特徴付ける。
DPIによって識別されるデータコピーは、一般的な高性能アーキテクチャに対して、プライバシと公正性の両方の脅威をもたらす。
論文 参考訳(メタデータ) (2024-06-18T19:05:24Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Data Collaboration Analysis applied to Compound Datasets and the
Introduction of Projection data to Non-IID settings [6.037276428689637]
フェデレートラーニングは複合データセットに適用され、予測精度を高めつつ、潜在的にプロプライエタリな情報を保護している。
データ協調分析(DCPd)と呼ばれる,オープンソースからの化学合成データに対する分散機械学習の代替手法を提案する。
DCPdはラベルバイアスの程度が異なる実験では分類精度が無視できる低下を示した。
論文 参考訳(メタデータ) (2023-08-01T04:37:08Z) - EaZy Learning: An Adaptive Variant of Ensemble Learning for Fingerprint
Liveness Detection [14.99677459192122]
指紋の生存度検出機構は、データセット内環境では良好に機能するが、クロスセンサーおよびクロスデータセット設定下では不幸にも失敗する。
指紋スプーフ検出器の一般化能力、堅牢性、相互運用性を高めるために、学習モデルはデータに適応する必要がある。
本稿では,熱心学習と遅延学習の中間に適応できる汎用モデルであるEaZy学習を提案する。
論文 参考訳(メタデータ) (2021-03-03T06:40:19Z) - ProxyFAUG: Proximity-based Fingerprint Augmentation [81.15016852963676]
ProxyFAUGはルールベースで近接性に基づく指紋増強法である。
このデータセット上で最高のパフォーマンスの測位法は、中央値エラーで40%改善され、平均誤差で6%向上した。
論文 参考訳(メタデータ) (2021-02-04T15:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。