論文の概要: TableMark: A Multi-bit Watermark for Synthetic Tabular Data
- arxiv url: http://arxiv.org/abs/2603.13722v1
- Date: Sat, 14 Mar 2026 03:01:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.359808
- Title: TableMark: A Multi-bit Watermark for Synthetic Tabular Data
- Title(参考訳): TableMark: 合成語彙データのためのマルチビット透かし
- Authors: Yuyang Xia, Yaoqiang Xu, Chen Qian, Yang Li, Guoliang Li, Jianhua Feng,
- Abstract要約: 電子透かしを合成表データにエンコードするマルチビット透かし方式TableMarkを設計する。
ここでは,TableMarkが多数のユーザを効果的に追跡し,攻撃に対して耐性を持ち,高いユーティリティを保っていることを示す。
- 参考スコア(独自算出の注目度): 17.704647776151745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Watermarking has emerged as an effective solution for copyright protection of synthetic data. However, applying watermarking techniques to synthetic tabular data presents challenges, as tabular data can easily lose their watermarks through shuffling or deletion operations. The major challenge is to provide traceability for tracking multiple users of the watermarked tabular data while maintaining high data utility and robustness (resistance to attacks). To address this, we design a multi-bit watermarking scheme TableMark that encodes watermarks into synthetic tabular data, ensuring superior traceability and robustness while maintaining high utility. We formulate the watermark encoding process as a constrained optimization problem, allowing the data owner to effectively trade off robustness and utility. Additionally, we propose effective optimization mechanisms to solve this problem to enhance the data utility. Experimental results on four widely used real-world datasets show that TableMark effectively traces a large number of users, is resilient to attacks, and preserves high utility. Moreover, TableMark significantly outperforms state-of-the-art tabular watermarking schemes.
- Abstract(参考訳): ウォーターマーキングは、合成データの著作権保護のための効果的なソリューションとして登場した。
しかし,表層データへの透かし技術の適用は,シャッフル操作や削除操作によって容易に透かしをなくすことができるため,課題を呈している。
最大の課題は、ハイデータユーティリティとロバスト性(アタックに対する耐性)を維持しながら、ウォーターマークされた表データの複数のユーザを追跡するトレーサビリティを提供することである。
そこで我々は,マルチビット透かし方式であるTableMarkを設計し,透かしを合成表データにエンコードし,高い実用性を維持しつつ,優れたトレーサビリティとロバスト性を確保する。
我々は、ウォーターマーク符号化プロセスを制約付き最適化問題として定式化し、データ所有者がロバスト性とユーティリティを効果的にトレードオフできるようにする。
さらに,この問題を解決するための効率的な最適化機構を提案し,データの有用性を向上する。
広く使われている4つの実世界のデータセットの実験結果から、TableMarkは事実上多数のユーザをトレースし、攻撃に対して耐性を持ち、高いユーティリティを保持する。
さらに、TableMarkは最先端のタブ形式の透かしスキームを大幅に上回っている。
関連論文リスト
- Data Watermarking for Sequential Recommender Systems [52.207721219147814]
逐次リコメンデータシステムにおけるデータ透かしの問題について検討する。
データセット全体のオーナシップを保護するデータセット透かしと,個々のユーザのデータを保護するユーザ透かしという2つの設定に重点を置いています。
論文 参考訳(メタデータ) (2024-11-20T02:34:21Z) - De-mark: Watermark Removal in Large Language Models [59.00698153097887]
我々は、n-gramベースの透かしを効果的に除去するために設計された高度なフレームワークであるDe-markを紹介する。
提案手法は,透かしの強度を評価するために,ランダム選択探索と呼ばれる新しいクエリ手法を利用する。
論文 参考訳(メタデータ) (2024-10-17T17:42:10Z) - Adaptive and Robust Watermark for Generative Tabular Data [9.275547262985917]
生成表データに対するフレキシブルでロバストな透かし機構を提案する。
ウォーターマークされたデータセットがデータ品質と下流のユーティリティに無視できる影響があることを理論的および実証的に示す。
論文 参考訳(メタデータ) (2024-09-23T04:37:30Z) - TabularMark: Watermarking Tabular Datasets for Machine Learning [20.978995194849297]
仮説テストに基づく透かし方式であるTabularMarkを提案する。
データノイズパーティショニングは、埋め込み中のデータ摂動に利用される。
実世界のデータセットと合成データセットの実験は、検出性、非侵入性、堅牢性においてTabularMarkの優位性を示している。
論文 参考訳(メタデータ) (2024-06-21T02:58:45Z) - Watermarking Generative Tabular Data [39.31042783480766]
提案した透かしは,データ忠実性を忠実に保ちながら,有効に検出できることを理論的に示す。
また,付加音に対する強靭性も示している。
論文 参考訳(メタデータ) (2024-05-22T21:52:12Z) - A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.40460716619772]
本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文 参考訳(メタデータ) (2023-10-11T17:57:35Z) - Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文 参考訳(メタデータ) (2023-03-20T21:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。