論文の概要: NCorr-FP: A Neighbourhood-based Correlation-preserving Fingerprinting Scheme for Intellectual Property Protection of Structured Data
- arxiv url: http://arxiv.org/abs/2505.06379v1
- Date: Fri, 09 May 2025 18:53:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.816023
- Title: NCorr-FP: A Neighbourhood-based Correlation-preserving Fingerprinting Scheme for Intellectual Property Protection of Structured Data
- Title(参考訳): NCorr-FP:構造化データの知的財産保護のための隣接型相関保存フィンガープリント方式
- Authors: Tanja Šarčević, Andreas Rauber, Rudolf Mayer,
- Abstract要約: NCorr-FPは近隣の相関保存フィンガープリントシステムである。
指紋は, 埋め込み比が高い場合でも, 微小ヘリンジャー距離とKLの発散がほとんど認められないことが確認できた。
本手法は,データ削除による検出信頼度を100%達成し,適応攻撃や衝突攻撃に対して頑健に維持する。
- 参考スコア(独自算出の注目度): 0.294944680995069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring data ownership and traceability of unauthorised redistribution are central to safeguarding intellectual property in shared data environments. Data fingerprinting addresses these challenges by embedding recipient-specific marks into the data, typically via content modifications. We propose NCorr-FP, a Neighbourhood-based Correlation-preserving Fingerprinting system for structured tabular data with the main goal of preserving statistical fidelity. The method uses local record similarity and density estimation to guide the insertion of fingerprint bits. The embedding logic is then reversed to extract the fingerprint from a potentially modified dataset. Extensive experiments confirm its effectiveness, fidelity, utility and robustness. Results show that fingerprints are virtually imperceptible, with minute Hellinger distances and KL divergences, even at high embedding ratios. The system also maintains high data utility for downstream predictive tasks. The method achieves 100\% detection confidence under substantial data deletions and remains robust against adaptive and collusion attacks. Satisfying all these requirements concurrently on mixed-type datasets highlights the strong applicability of NCorr-FP to real-world data settings.
- Abstract(参考訳): 権限のない再配布のデータの所有権とトレーサビリティを保証することは、共有データ環境における知的財産の保護の中心である。
データフィンガープリントは、典型的にはコンテンツ修正を通じて、受信者固有のマークをデータに埋め込むことによって、これらの課題に対処する。
そこで我々は,NCorr-FPを提案する。NCorr-FP,NCorr-FP,Neighbourhood-based correlation-serving Fingerprinting system for structured tabular data with the main goal toserving statistics fidelity。
この方法は、局所記録類似度と密度推定を用いて指紋ビットの挿入を誘導する。
埋め込みロジックは反転して、潜在的に修正されたデータセットから指紋を抽出する。
大規模な実験により、その有効性、忠実性、実用性、堅牢性が確認されている。
その結果, 指紋は, 高埋め込み比においても, 微小ヘリンジャー距離とKLの発散がほとんど認められないことが判明した。
システムは下流予測タスクのための高データユーティリティも維持する。
本手法は,データ削除による検出信頼度100\%を実現し,アダプティブアタックやコラシオンアタックに対して頑健である。
混合型データセットでこれらすべての要件を同時に満たすことで、NCorr-FPが現実世界のデータ設定に強く適用可能であることが強調される。
関連論文リスト
- Benchmarking Fraud Detectors on Private Graph Data [70.4654745317714]
現在、多くの種類の不正は、グラフ上で動く自動検出アルゴリズムによって部分的に管理されている。
データ保有者が不正検知器の開発を第三者にアウトソースしようとするシナリオを考察する。
サードパーティは、不正検出をデータ保持者に送信し、これらのアルゴリズムをプライベートデータセットで評価し、その結果を公表する。
本システムに対する現実的なプライバシ攻撃を提案し,評価結果のみに基づいて個人データの匿名化を可能にする。
論文 参考訳(メタデータ) (2025-07-30T03:20:15Z) - Clustered Federated Learning for Generalizable FDIA Detection in Smart Grids with Heterogeneous Data [9.222461989780735]
False Data Injection Attacks (FDIA)は、スマートグリッドに深刻なセキュリティリスクをもたらす。
従来の集中型トレーニングアプローチは、プライバシのリスクやデータ共有の制約に直面するだけでなく、高い送信コストを発生させる。
本稿では,FedClusAvg(Federated Cluster Average)を提案する。
論文 参考訳(メタデータ) (2025-07-20T15:10:43Z) - Unlocking Post-hoc Dataset Inference with Synthetic Data [11.886166976507711]
トレーニングデータセットは、データ所有者の知的財産権を尊重することなく、しばしばインターネットから取り除かれる。
推論(DI)は、被疑者データセットがトレーニングに使用されたかどうかを特定することで潜在的な治療を提供する。
既存のDIメソッドでは、妥協したデータセットの分布と密接に一致するトレーニングを欠くために、プライベートな設定を必要とします。
本研究では,必要なホールドアウト集合を合成的に生成することで,この問題に対処する。
論文 参考訳(メタデータ) (2025-06-18T08:46:59Z) - A Federated Random Forest Solution for Secure Distributed Machine Learning [44.99833362998488]
本稿では,データプライバシを保護し,分散環境での堅牢な性能を提供するランダムフォレスト分類器のためのフェデレート学習フレームワークを提案する。
PySyftをセキュアでプライバシを意識した計算に活用することにより、複数の機関がローカルに保存されたデータ上でランダムフォレストモデルを協調的にトレーニングすることが可能となる。
2つの実世界の医療ベンチマークの実験は、フェデレートされたアプローチが、集中型のメソッドの最大9%のマージンで、競争の正確性を維持していることを示している。
論文 参考訳(メタデータ) (2025-05-12T21:40:35Z) - CBW: Towards Dataset Ownership Verification for Speaker Verification via Clustering-based Backdoor Watermarking [85.68235482145091]
大規模音声データセットは貴重な知的財産となった。
本稿では,新しいデータセットのオーナシップ検証手法を提案する。
我々のアプローチはクラスタリングに基づくバックドア透かし(CBW)を導入している。
我々は,ベンチマークデータセットに対する広範な実験を行い,本手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2025-03-02T02:02:57Z) - Contrastive Learning-Based privacy metrics in Tabular Synthetic Datasets [40.67424997797513]
合成データは、医療や金融などの分野におけるプライバシー強化技術(PET)として注目されている。
類似度に基づく手法は、トレーニングと合成データとの類似度のレベルを求めることを目的としている。
攻撃に基づく手法は、合成データセットに対する故意の攻撃を誘発する。
論文 参考訳(メタデータ) (2025-02-19T15:52:23Z) - FedDW: Distilling Weights through Consistency Optimization in Heterogeneous Federated Learning [14.477559543490242]
Federated Learning(FL)は、データの集中化なしにデバイス間でのニューラルネットワークトレーニングを可能にする、革新的な分散機械学習パラダイムである。
従来の研究では、IID環境では、モデルのパラメータ構造が特定の一貫性の原則に従うことが期待されている。
本稿では,両者の整合性を識別し,FedDWフレームワークの基盤となるトレーニングの調整に活用する。
実験結果から,FedDWは10種類の最先端FL法より優れ,高度不均一条件下では平均3%精度が向上した。
論文 参考訳(メタデータ) (2024-12-05T12:32:40Z) - Data Plagiarism Index: Characterizing the Privacy Risk of Data-Copying in Tabular Generative Models [9.784347635082232]
本稿では,データプラジャリズム指標(Data Plagiarism Index)と呼ばれる新しい類似度指標とメンバーシップ推論攻撃を提案する。
DPIはデータコピーの直感的な定義を評価し,それに対応するプライバシリスクを特徴付ける。
DPIによって識別されるデータコピーは、一般的な高性能アーキテクチャに対して、プライバシと公正性の両方の脅威をもたらす。
論文 参考訳(メタデータ) (2024-06-18T19:05:24Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Data Collaboration Analysis applied to Compound Datasets and the
Introduction of Projection data to Non-IID settings [6.037276428689637]
フェデレートラーニングは複合データセットに適用され、予測精度を高めつつ、潜在的にプロプライエタリな情報を保護している。
データ協調分析(DCPd)と呼ばれる,オープンソースからの化学合成データに対する分散機械学習の代替手法を提案する。
DCPdはラベルバイアスの程度が異なる実験では分類精度が無視できる低下を示した。
論文 参考訳(メタデータ) (2023-08-01T04:37:08Z) - EaZy Learning: An Adaptive Variant of Ensemble Learning for Fingerprint
Liveness Detection [14.99677459192122]
指紋の生存度検出機構は、データセット内環境では良好に機能するが、クロスセンサーおよびクロスデータセット設定下では不幸にも失敗する。
指紋スプーフ検出器の一般化能力、堅牢性、相互運用性を高めるために、学習モデルはデータに適応する必要がある。
本稿では,熱心学習と遅延学習の中間に適応できる汎用モデルであるEaZy学習を提案する。
論文 参考訳(メタデータ) (2021-03-03T06:40:19Z) - ProxyFAUG: Proximity-based Fingerprint Augmentation [81.15016852963676]
ProxyFAUGはルールベースで近接性に基づく指紋増強法である。
このデータセット上で最高のパフォーマンスの測位法は、中央値エラーで40%改善され、平均誤差で6%向上した。
論文 参考訳(メタデータ) (2021-02-04T15:59:30Z) - ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for
Semi-supervised Continual Learning [52.831894583501395]
連続学習は、入力されたデータが完全にラベル付けされていると仮定し、実際のアプリケーションでは適用できないかもしれない。
我々は、条件付き生成逆数ネットワーク(GAN)を用いた分類器を相互に学習するために、識別器整合(ORDisCo)を用いたディープオンライン再生を提案する。
ORDisCo が SSCL の様々な半教師付き学習ベンチマークデータセットで大幅なパフォーマンス向上を達成していることを示します。
論文 参考訳(メタデータ) (2021-01-02T09:04:14Z) - Federated Doubly Stochastic Kernel Learning for Vertically Partitioned
Data [93.76907759950608]
本稿では,垂直分割データに対する2倍のカーネル学習アルゴリズムを提案する。
本稿では,FDSKLがカーネルを扱う場合,最先端のフェデレーション学習手法よりもはるかに高速であることを示す。
論文 参考訳(メタデータ) (2020-08-14T05:46:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。