Fugu-MT 論文翻訳(概要): A Robust Semantics-based Watermark for Large Language Model against Paraphrasing

論文の概要: A Robust Semantics-based Watermark for Large Language Model against Paraphrasing

arxiv url: http://arxiv.org/abs/2311.08721v2
Date: Mon, 1 Apr 2024 17:44:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-04 12:23:14.933851
Title: A Robust Semantics-based Watermark for Large Language Model against Paraphrasing
Title（参考訳）: 言い換えに対する大規模言語モデルのためのロバストなセマンティックスに基づく透かし
Authors: Jie Ren, Han Xu, Yiding Liu, Yingqian Cui, Shuaiqiang Wang, Dawei Yin, Jiliang Tang,
Abstract要約: 大規模言語モデル(LLM)は、様々な自然言語処理において優れた能力を示している。 LLMは不適切にも違法にも使用できるという懸念がある。本稿ではセマンティクスに基づく透かしフレームワークSemaMarkを提案する。
参考スコア（独自算出の注目度）: 50.84892876636013
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) have show great ability in various natural language tasks. However, there are concerns that LLMs are possible to be used improperly or even illegally. To prevent the malicious usage of LLMs, detecting LLM-generated text becomes crucial in the deployment of LLM applications. Watermarking is an effective strategy to detect the LLM-generated content by encoding a pre-defined secret watermark to facilitate the detection process. However, the majority of existing watermark methods leverage the simple hashes of precedent tokens to partition vocabulary. Such watermark can be easily eliminated by paraphrase and correspondingly the detection effectiveness will be greatly compromised. Thus, to enhance the robustness against paraphrase, we propose a semantics-based watermark framework SemaMark. It leverages the semantics as an alternative to simple hashes of tokens since the paraphrase will likely preserve the semantic meaning of the sentences. Comprehensive experiments are conducted to demonstrate the effectiveness and robustness of SemaMark under different paraphrases.
Abstract（参考訳）: 大規模言語モデル(LLM)は、様々な自然言語処理において優れた能力を示している。しかし、LSMは不適切な、あるいは違法に使用することができるという懸念もある。 LLMの悪意ある使用を防ぐために、LLMアプリケーションのデプロイにおいてLLM生成テキストの検出が重要となる。透かしは、予め定義された秘密透かしを符号化してLLM生成内容を検出し、検出プロセスを容易にする効果的な方法である。しかし、既存の透かし法の大半は、前例のトークンの単純なハッシュを利用して語彙を分割する。このような透かしはパラフレーズで簡単に除去でき、それに応じて検出の有効性が大幅に損なわれる。そこで本研究では,セマンティックスに基づく透かしフレームワークSemaMarkを提案する。これは意味論を単純なトークンのハッシュの代替として利用している。異なるパラフレーズの下でSemaMarkの有効性とロバスト性を示すための総合的な実験を行った。

関連論文リスト

StealthInk: A Multi-bit and Stealthy Watermark for Large Language Models [4.76514657698929]
StealthInkは、大規模言語モデル(LLM)のためのステルスなマルチビット透かし方式である元のテキスト配布を保存し、証明データの埋め込みを可能にする。固定等誤り率で透かし検出に必要なトークン数に対する低い境界を導出する。
論文参考訳（メタデータ） (2025-06-05T18:37:38Z)
Watermarking Needs Input Repetition Masking [13.309409725789433]
人間とLarge Language Models(LLM)の両方が、一見不可能な設定でも、透かし信号を含む模倣に終わることを示す。これは現在の学術的な仮定に挑戦し、長期的な透かしが信頼できるためには、偽陽性の可能性が著しく低い必要があることを示唆している。
論文参考訳（メタデータ） (2025-04-16T16:25:26Z)
SimMark: A Robust Sentence-Level Similarity-Based Watermarking Algorithm for Large Language Models [4.069844339028727]
SimMarkは、大規模言語モデル(LLM)のための堅牢な文レベルの透かしアルゴリズムである。検出可能な統計的パターンを組み込んでおり、ソフトカウント機構を採用している。我々は,LLM生成コンテンツのロバストな透かしのための新しいベンチマークをSimMarkが設定していることを示す。
論文参考訳（メタデータ） (2025-02-05T00:21:01Z)
Less is More: Sparse Watermarking in LLMs with Enhanced Text Quality [27.592486717044455]
テキストに分散した生成されたトークンの小さなサブセットに透かしを適用することで、このトレードオフを緩和することを目的とした新しいタイプの透かしであるスパース透かしを提案する。提案手法は,従来の透かし手法よりも高い品質のテキストを生成しつつ,高い検出性を実現することを示す。
論文参考訳（メタデータ） (2024-07-17T18:52:12Z)
Waterfall: Framework for Robust and Scalable Text Watermarking and Provenance for LLMs [36.068335914828396]
我々は、堅牢でスケーラブルなテキスト透かしのための最初のトレーニング不要のフレームワークであるWaterfallを提案する。ウォーターフォールは、SOTAの記事テキストによるウォーターマーキング法と比較して、スケーラビリティ、堅牢な検証可能性、計算効率を著しく向上させる。
論文参考訳（メタデータ） (2024-07-05T10:51:33Z)
WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.61972059246715]
本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文参考訳（メタデータ） (2023-11-16T11:58:31Z)
A Semantic Invariant Robust Watermark for Large Language Models [27.522264953691746]
以前の透かしアルゴリズムは、攻撃の堅牢性とセキュリティの堅牢性の間のトレードオフに直面していた。これは、トークンの透かしロジットが、先行するトークンの数によって決定されるためである。攻撃の堅牢性とセキュリティの堅牢性の両方を提供するLLMのセマンティック不変な透かし手法を提案する。
論文参考訳（メタデータ） (2023-10-10T06:49:43Z)
SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文参考訳（メタデータ） (2023-10-06T03:33:42Z)
Towards Codable Watermarking for Injecting Multi-bits Information to LLMs [86.86436777626959]
大規模言語モデル(LLM)は、流布とリアリズムを増大させるテキストを生成する。既存の透かし方式はエンコーディング非効率であり、多様な情報エンコーディングニーズに柔軟に対応できない。テキスト透かしを複数ビットでカスタマイズ可能な情報を運ぶことができるCTWL (Codable Text Watermarking for LLMs) を提案する。
論文参考訳（メタデータ） (2023-07-29T14:11:15Z)
On the Reliability of Watermarks for Large Language Models [95.87476978352659]
本研究では,人間による書き直し後の透かしテキストの堅牢性,非透かしLDMによる言い換え,あるいはより長い手書き文書への混在性について検討する。人や機械の言い回しをしても、透かしは検出可能である。また、大きな文書に埋め込まれた透かし付きテキストの短いスパンに敏感な新しい検出手法についても検討する。
論文参考訳（メタデータ） (2023-06-07T17:58:48Z)
Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文参考訳（メタデータ） (2021-12-15T04:27:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。