論文の概要: Uncovering the Hidden Threat of Text Watermarking from Users with Cross-Lingual Knowledge
- arxiv url: http://arxiv.org/abs/2502.16699v1
- Date: Sun, 23 Feb 2025 19:49:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:57:53.085476
- Title: Uncovering the Hidden Threat of Text Watermarking from Users with Cross-Lingual Knowledge
- Title(参考訳): 言語横断的知識を持つユーザからテキスト透かしの隠れた脅威を明らかにする
- Authors: Mansour Al Ghanim, Jiaqi Xue, Rochana Prih Hastuti, Mengxin Zheng, Yan Solihin, Qian Lou,
- Abstract要約: 本研究は,言語間知識を持つユーザによるテキスト透かしに対する隠れた脅威に焦点を当てた。
言語学的に豊かな4言語にまたがる4つの透かし手法を評価し,透かしのレジリエンスとテキストの品質を検討した。
我々の焦点は、言語横断的な専門知識を持つ敵を特徴とする現実的なシナリオであり、このような課題に対する現在の透かし手法の妥当性を評価することである。
- 参考スコア(独自算出の注目度): 12.5065555498478
- License:
- Abstract: In this study, we delve into the hidden threats posed to text watermarking by users with cross-lingual knowledge. While most research focuses on watermarking methods for English, there is a significant gap in evaluating these methods in cross-lingual contexts. This oversight neglects critical adversary scenarios involving cross-lingual users, creating uncertainty regarding the effectiveness of cross-lingual watermarking. We assess four watermarking techniques across four linguistically rich languages, examining watermark resilience and text quality across various parameters and attacks. Our focus is on a realistic scenario featuring adversaries with cross-lingual expertise, evaluating the adequacy of current watermarking methods against such challenges.
- Abstract(参考訳): 本研究では,言語間知識を持つユーザによるテキスト透かしによる隠れた脅威を探索する。
ほとんどの研究は英語の透かし手法に重点を置いているが、言語間文脈におけるこれらの手法の評価には大きなギャップがある。
この監視は、言語横断ユーザに関わる重要な敵シナリオを無視し、言語横断透かしの有効性に関する不確実性を生んでいる。
言語学的に豊かな4言語にまたがる4つの透かし手法を評価し,様々なパラメータや攻撃に対して,透かしのレジリエンスとテキスト品質を検討した。
我々の焦点は、言語横断的な専門知識を持つ敵を特徴とする現実的なシナリオであり、このような課題に対する現在の透かし手法の妥当性を評価することである。
関連論文リスト
- On Evaluating The Performance of Watermarked Machine-Generated Texts Under Adversarial Attacks [20.972194348901958]
まず、メインストリームのウォーターマーキングスキームと、機械生成テキストに対する削除攻撃を組み合わせます。
8つの透かし(5つのプレテキスト、3つのポストテキスト)と12のアタック(2つのプレテキスト、10のポストテキスト)を87のシナリオで評価した。
その結果、KGWとExponentialの透かしは高いテキスト品質と透かしの保持を提供するが、ほとんどの攻撃に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2024-07-05T18:09:06Z) - From Intentions to Techniques: A Comprehensive Taxonomy and Challenges in Text Watermarking for Large Language Models [6.2153353110363305]
本稿では,透かし技術設計の背景にある様々な視点を統一的に概観する。
我々は異なる透かし技術の背後にある特定の意図に基づいて研究を分析する。
テキスト作成者保護の研究を促進するために,テキスト透かしにおけるギャップとオープンな課題を強調した。
論文 参考訳(メタデータ) (2024-06-17T00:09:31Z) - Duwak: Dual Watermarks in Large Language Models [49.00264962860555]
トークン確率分布とサンプリングスキームの両方に二重秘密パターンを埋め込むことにより、透かしの効率と品質を向上させるために、Duwakを提案する。
Llama2でDuwakを4つの最先端透かし技術と組み合わせて評価した。
論文 参考訳(メタデータ) (2024-03-12T16:25:38Z) - Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models [48.409979469683975]
テキスト透かしにおける言語間整合性の概念を紹介する。
予備的な実証実験の結果、現在のテキスト透かし技術は、テキストが様々な言語に翻訳されるときに一貫性が欠如していることが判明した。
透かしを回避するための言語横断型透かし除去攻撃(CWRA)を提案する。
論文 参考訳(メタデータ) (2024-02-21T18:48:38Z) - Cross-Attention Watermarking of Large Language Models [8.704964543257246]
言語モデルの言語透かしに対する新しいアプローチを示す。
情報は、読みやすさと本来の意味を保ちながら、出力テキストに不可避的に挿入される。
クロスアテンションメカニズムは、推論中にテキストに透かしを埋め込むのに使われる。
論文 参考訳(メタデータ) (2024-01-12T09:39:50Z) - I Know You Did Not Write That! A Sampling Based Watermarking Method for
Identifying Machine Generated Text [0.0]
機械生成テキストを検出するための新しい透かし手法を提案する。
我々の方法は生成されたテキストにユニークなパターンを埋め込む。
本稿では,透かしがテキスト品質にどのように影響するかを示し,提案手法を最先端の透かし法と比較する。
論文 参考訳(メタデータ) (2023-11-29T20:04:57Z) - WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.61972059246715]
本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。
透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文 参考訳(メタデータ) (2023-11-16T11:58:31Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - Watermarking Conditional Text Generation for AI Detection: Unveiling
Challenges and a Semantic-Aware Watermark Remedy [52.765898203824975]
本研究では,条件付きテキスト生成と入力コンテキストの特性を考慮した意味認識型透かしアルゴリズムを提案する。
実験結果から,提案手法は様々なテキスト生成モデルに対して大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-07-25T20:24:22Z) - Cross-Lingual Speaker Identification Using Distant Supervision [84.51121411280134]
本稿では,文脈推論の欠如や言語間一般化の低さといった問題に対処する話者識別フレームワークを提案する。
その結果,2つの英語話者識別ベンチマークにおいて,従来の最先端手法よりも9%の精度,5%の精度で性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-11T20:49:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。