論文の概要: TAB-DRW: A DFT-based Robust Watermark for Generative Tabular Data
- arxiv url: http://arxiv.org/abs/2511.21600v1
- Date: Wed, 26 Nov 2025 17:16:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.219349
- Title: TAB-DRW: A DFT-based Robust Watermark for Generative Tabular Data
- Title(参考訳): TAB-DRW:DFTに基づく生成語彙データのためのロバストな透かし
- Authors: Yizhou Zhao, Xiang Li, Peter Song, Qi Long, Weijie Su,
- Abstract要約: 本稿では,効率的で堅牢な電子透かし方式であるTAB-DRWを提案する。
TAB-DRWは周波数領域に透かし信号を埋め込む。
ヨー・ジョンソン変換と標準化を通じて不均一な特徴を正規化する。
予め計算された擬似ランダムビットに応じて適応的に選択されたエントリの虚部を調整する。
- 参考スコア(独自算出の注目度): 19.563384542538348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of generative AI has enabled the production of high-fidelity synthetic tabular data across fields such as healthcare, finance, and public policy, raising growing concerns about data provenance and misuse. Watermarking offers a promising solution to address these concerns by ensuring the traceability of synthetic data, but existing methods face many limitations: they are computationally expensive due to reliance on large diffusion models, struggle with mixed discrete-continuous data, or lack robustness to post-modifications. To address them, we propose TAB-DRW, an efficient and robust post-editing watermarking scheme for generative tabular data. TAB-DRW embeds watermark signals in the frequency domain: it normalizes heterogeneous features via the Yeo-Johnson transformation and standardization, applies the discrete Fourier transform (DFT), and adjusts the imaginary parts of adaptively selected entries according to precomputed pseudorandom bits. To further enhance robustness and efficiency, we introduce a novel rank-based pseudorandom bit generation method that enables row-wise retrieval without incurring storage overhead. Experiments on five benchmark tabular datasets show that TAB-DRW achieves strong detectability and robustness against common post-processing attacks, while preserving high data fidelity and fully supporting mixed-type features.
- Abstract(参考訳): 生成AIの台頭により、医療、金融、公共政策といった分野にまたがる高忠実な合成表データの作成が可能となり、データの出所や誤用に対する懸念が高まっている。
ウォーターマーキングは、合成データのトレーサビリティを保証することでこれらの問題に対処する有望なソリューションを提供するが、既存の方法は、大きな拡散モデルに依存しているため計算的に高価であり、離散連続データとの混在、あるいは修正後の堅牢性の欠如など、多くの制限に直面している。
そこで本研究では,生成表データに対する効率的かつ堅牢な電子透かし方式であるTAB-DRWを提案する。
TAB-DRWは周波数領域に透かし信号を埋め込む:Yeo-Johnson変換と標準化により不均一な特徴を正規化し、離散フーリエ変換(DFT)を適用し、事前計算された擬似ランダムビットに従って適応的に選択されたエントリの虚部を調整する。
さらにロバスト性や効率性を高めるため,ストレージのオーバーヘッドを発生させることなく行ワイズ検索が可能なランクベースの擬似ランダムビット生成手法を提案する。
5つのベンチマーク表データセットの実験では、TAB-DRWは一般的な後処理攻撃に対して強力な検出性と堅牢性を達成し、高いデータ忠実性を保持し、混合型機能を完全にサポートしている。
関連論文リスト
- DSSmoothing: Toward Certified Dataset Ownership Verification for Pre-trained Language Models via Dual-Space Smoothing [36.37263264594975]
既存のデータセットのオーナシップ検証手法は、推論中に透かしが安定していると仮定する。
2次元空間の平滑化に基づく PLM のための最初の認証済みデータセットのオーナシップ検証手法を提案する。
DSSmoothingは安定かつ信頼性の高い検証性能を実現し、潜在的適応攻撃に対する堅牢性を示す。
論文 参考訳(メタデータ) (2025-10-17T04:25:32Z) - TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.50296404732902]
グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文 参考訳(メタデータ) (2024-10-27T22:58:47Z) - Adaptive and Robust Watermark for Generative Tabular Data [9.275547262985917]
生成表データに対するフレキシブルでロバストな透かし機構を提案する。
ウォーターマークされたデータセットがデータ品質と下流のユーティリティに無視できる影響があることを理論的および実証的に示す。
論文 参考訳(メタデータ) (2024-09-23T04:37:30Z) - Efficient Generative Modeling via Penalized Optimal Transport Network [1.8079016557290342]
本稿では,Wartherally-penalized Wasserstein (MPW) 距離に基づく多目的深部生成モデルを提案する。
MPW距離を通じて、POTNetは、低次元の辺縁情報を利用して、関節分布の全体的アライメントを導出する。
我々は,MPW損失の一般化誤差に基づく非漸近的境界を導出し,POTNetで学習した生成分布の収束率を確立する。
論文 参考訳(メタデータ) (2024-02-16T05:27:05Z) - FedTabDiff: Federated Learning of Diffusion Probabilistic Models for
Synthetic Mixed-Type Tabular Data Generation [5.824064631226058]
textitFederated Tabular Diffusion (FedTabDiff) を導入し、元のデータセットに一元的にアクセスすることなく、高忠実な混合型表型データを生成する。
FedTabDiffは、データプライバシとローカリティを尊重しながら、複数のエンティティが共同で生成モデルをトレーニングできるようにする分散学習方式を実現する。
実世界の金融および医療データセットに関する実験的評価は、高い忠実性、ユーティリティ、プライバシ、カバレッジを維持する合成データを生成するフレームワークの能力を実証している。
論文 参考訳(メタデータ) (2024-01-11T21:17:50Z) - Uncertainty-Aware Source-Free Adaptive Image Super-Resolution with Wavelet Augmentation Transformer [60.31021888394358]
Unsupervised Domain Adaptation (UDA)は、現実世界の超解像(SR)における領域ギャップ問題に効果的に対処できる
本稿では,画像SR(SODA-SR)のためのSOurce-free Domain Adaptationフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-31T03:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。