論文の概要: MUSE: Model-Agnostic Tabular Watermarking via Multi-Sample Selection
- arxiv url: http://arxiv.org/abs/2505.24267v1
- Date: Fri, 30 May 2025 06:45:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.809946
- Title: MUSE: Model-Agnostic Tabular Watermarking via Multi-Sample Selection
- Title(参考訳): MUSE:マルチサンプル選択によるモデルに依存しないタブラルウォーターマーキング
- Authors: Liancheng Fang, Aiwei Liu, Henry Peng Zou, Yankai Chen, Hengrui Zhang, Zhongfen Deng, Philip S. Yu,
- Abstract要約: MUSEは表生成モデルの透かしアルゴリズムである。
複数の候補サンプルを生成し、特殊なスコアリング関数に基づいて1つを選択することで、透かしを埋め込む。
様々な攻撃に対して最先端の透かし検出性と堅牢性を実現する。
- 参考スコア(独自算出の注目度): 39.03834482470989
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce MUSE, a watermarking algorithm for tabular generative models. Previous approaches typically leverage DDIM invertibility to watermark tabular diffusion models, but tabular diffusion models exhibit significantly poorer invertibility compared to other modalities, compromising performance. Simultaneously, tabular diffusion models require substantially less computation than other modalities, enabling a multi-sample selection approach to tabular generative model watermarking. MUSE embeds watermarks by generating multiple candidate samples and selecting one based on a specialized scoring function, without relying on model invertibility. Our theoretical analysis establishes the relationship between watermark detectability, candidate count, and dataset size, allowing precise calibration of watermarking strength. Extensive experiments demonstrate that MUSE achieves state-of-the-art watermark detectability and robustness against various attacks while maintaining data quality, and remains compatible with any tabular generative model supporting repeated sampling, effectively addressing key challenges in tabular data watermarking. Specifically, it reduces the distortion rates on fidelity metrics by 81-89%, while achieving a 1.0 TPR@0.1%FPR detection rate. Implementation of MUSE can be found at https://github.com/fangliancheng/MUSE.
- Abstract(参考訳): 本稿では,表生成モデルの透かしアルゴリズムであるMUSEを紹介する。
従来の手法では、一般にDDIMの可逆性を透かしの表層拡散モデルに応用するが、表層拡散モデルは他のモダリティに比べてかなり低い可逆性を示し、性能を損なう。
同時に、表型拡散モデルは、他のモダリティよりも大幅に少ない計算を必要とするため、表型生成モデル透かしに対するマルチサンプル選択アプローチが可能である。
MUSEは、モデルの可逆性に頼ることなく、複数の候補サンプルを生成し、特定のスコアリング関数に基づいて1つを選択することで、透かしを埋め込む。
我々の理論的分析は、透かし検出可能性、候補数、データセットサイズの関係を確立し、透かし強度の正確な校正を可能にする。
大規模な実験により、MUSEはデータ品質を維持しながら様々な攻撃に対して最先端の透かし検出性と堅牢性を達成し、繰り返しサンプリングをサポートする任意の表生成モデルと互換性を保ち、表データ透かしにおける重要な課題に効果的に対処することを示した。
具体的には、信頼度測定値の歪み率を81~89%削減し、TPR@0.1%FPR検出率1.0を達成する。
MUSEの実装はhttps://github.com/fangliancheng/MUSEで見ることができる。
関連論文リスト
- Improved Unbiased Watermark for Large Language Models [59.00698153097887]
本稿では,非バイアスのマルチチャネル型透かしであるMCmarkを紹介する。
MCmarkは言語モデルの本来の分布を保存する。
既存の非バイアスの透かしよりも検出性と堅牢性を大幅に改善する。
論文 参考訳(メタデータ) (2025-02-16T21:02:36Z) - MAPL: Memory Augmentation and Pseudo-Labeling for Semi-Supervised Anomaly Detection [0.0]
メモリ拡張(Memory Augmentation)と擬似ラベル(Pseudo-Labeling, MAPL)と呼ばれる, 産業環境における表面欠陥検出のための新しいメソドロジーを導入する。
この手法は、まず異常シミュレーション戦略を導入し、希少または未知の異常型を認識するモデルの能力を著しく改善する。
入力データから直接異常領域を識別するために、MAPLによってエンドツーエンドの学習フレームワークが使用される。
論文 参考訳(メタデータ) (2024-05-10T02:26:35Z) - TokenMark: A Modality-Agnostic Watermark for Pre-trained Transformers [67.57928750537185]
TokenMarkは、事前訓練されたモデルに対する頑健で、モダリティに依存しない、堅牢な透かしシステムである。
予めトレーニングされたモデルを、特別に置換されたデータサンプルのセットに微調整することで、透かしを埋め込む。
これはモデル透かしの堅牢性、効率、普遍性を著しく改善する。
論文 参考訳(メタデータ) (2024-03-09T08:54:52Z) - IBADR: an Iterative Bias-Aware Dataset Refinement Framework for
Debiasing NLU models [52.03761198830643]
IBADR(Iterative Bias-Aware dataset Refinement framework)を提案する。
まず、プール内のサンプルのバイアス度を定量化するために浅いモデルを訓練する。
次に、各サンプルにバイアス度を表すバイアス指標をペアにして、これらの拡張サンプルを使用してサンプルジェネレータを訓練する。
このようにして、このジェネレータは、バイアスインジケータとサンプルの対応関係を効果的に学習することができる。
論文 参考訳(メタデータ) (2023-11-01T04:50:38Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。