論文の概要: A Linguistics-Aware LLM Watermarking via Syntactic Predictability
- arxiv url: http://arxiv.org/abs/2510.13829v1
- Date: Fri, 10 Oct 2025 07:26:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.454568
- Title: A Linguistics-Aware LLM Watermarking via Syntactic Predictability
- Title(参考訳): 構文予測可能性を用いた言語学的LLM透かし
- Authors: Shinwoo Park, Hyejin Park, Hyeseon Ahn, Yo-Sub Han,
- Abstract要約: STELAは,言語固有の言語的自由度と透かし強度を一致させる新しい枠組みである。
我々の検出器は、いかなるモデルロジットもアクセスせずに動作し、公に検証可能な検出を容易にする。
- 参考スコア(独自算出の注目度): 9.249768575382397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As large language models (LLMs) continue to advance rapidly, reliable governance tools have become critical. Publicly verifiable watermarking is particularly essential for fostering a trustworthy AI ecosystem. A central challenge persists: balancing text quality against detection robustness. Recent studies have sought to navigate this trade-off by leveraging signals from model output distributions (e.g., token-level entropy); however, their reliance on these model-specific signals presents a significant barrier to public verification, as the detection process requires access to the logits of the underlying model. We introduce STELA, a novel framework that aligns watermark strength with the linguistic degrees of freedom inherent in language. STELA dynamically modulates the signal using part-of-speech (POS) n-gram-modeled linguistic indeterminacy, weakening it in grammatically constrained contexts to preserve quality and strengthen it in contexts with greater linguistic flexibility to enhance detectability. Our detector operates without access to any model logits, thus facilitating publicly verifiable detection. Through extensive experiments on typologically diverse languages-analytic English, isolating Chinese, and agglutinative Korean-we show that STELA surpasses prior methods in detection robustness. Our code is available at https://github.com/Shinwoo-Park/stela_watermark.
- Abstract(参考訳): 大規模言語モデル(LLM)が急速に進歩するにつれ、信頼できるガバナンスツールが重要になってきています。
公に検証可能な透かしは、信頼できるAIエコシステムを育むために特に不可欠である。
テキスト品質と検出の堅牢性とのバランス。
近年の研究では、モデル出力分布(例えばトークンレベルのエントロピー)からの信号を活用することで、このトレードオフを導こうとしているが、これらのモデル固有の信号への依存は、検出プロセスが基礎となるモデルのロジットへのアクセスを必要とするため、公共の検証にとって大きな障壁となる。
STELAは,言語固有の言語的自由度と透かし強度を一致させる新しいフレームワークである。
STELAは、部分音声(POS)のn-gramモデルによる言語的不確定性を用いて信号を動的に変調し、文法的に制約された文脈でそれを弱め、品質を保ち、言語的柔軟性を高めて検出性を高める。
我々の検出器は、いかなるモデルロジットもアクセスせずに動作し、公に検証可能な検出を容易にする。
タイポロジー的に多種多様な言語に関する広範な実験を通じて、中国語を分離し、韓国語を凝集させることにより、STELAはロバスト性の検出に先立つ手法を超越していることが示されている。
私たちのコードはhttps://github.com/Shinwoo-Park/stela_watermarkで公開しています。
関連論文リスト
- An Ensemble Framework for Unbiased Language Model Watermarking [60.99969104552168]
本研究では,アンサンブル・フレームワークであるENSを提案する。
ENSは複数の独立した透かしインスタンスを順次構成し、それぞれ異なるキーによって管理され、透かし信号を増幅する。
実験的な評価では、ENSは信頼できる検出に必要なトークンの数を大幅に減らし、平滑化やパラフレージング攻撃に対する耐性を高めている。
論文 参考訳(メタデータ) (2025-09-28T19:37:44Z) - Sign Spotting Disambiguation using Large Language Models [29.79050316749927]
本稿では,Large Language Models(LLMs)を統合して,符号スポッティング品質を大幅に向上させる,学習自由フレームワークを提案する。
提案手法は,グローバル・テンポラル・ハンド形状の特徴を抽出し,その特徴を大規模手話辞書と照合する。
この辞書ベースのマッチングは本質的に、モデルの再訓練を必要とせず、より優れた語彙の柔軟性を提供する。
論文 参考訳(メタデータ) (2025-07-04T16:38:09Z) - Improved Unbiased Watermark for Large Language Models [59.00698153097887]
本稿では,非バイアスのマルチチャネル型透かしであるMCmarkを紹介する。
MCmarkは言語モデルの本来の分布を保存する。
既存の非バイアスの透かしよりも検出性と堅牢性を大幅に改善する。
論文 参考訳(メタデータ) (2025-02-16T21:02:36Z) - GaussMark: A Practical Approach for Structural Watermarking of Language Models [61.84270985214254]
GaussMarkは、大規模な言語モデルを透かし出すためのシンプルで効率的で比較的堅牢なスキームである。
GaussMarkは信頼性が高く、効率的で、挿入、削除、置換、ラウンドトリップ翻訳などの汚職に対して比較的堅牢であることを示す。
論文 参考訳(メタデータ) (2025-01-17T22:30:08Z) - Learnable Linguistic Watermarks for Tracing Model Extraction Attacks on Large Language Models [20.44680783275184]
モデル抽出攻撃に対する現在の透かし技術は、モデルロジットの信号挿入や生成されたテキストの後処理に依存している。
大規模言語モデル(LLM)に学習可能な言語透かしを埋め込む新しい手法を提案する。
制御ノイズをトークン周波数分布に導入し,統計的に識別可能な透かしを埋め込むことにより,LLMの出力分布を微調整する。
論文 参考訳(メタデータ) (2024-04-28T14:45:53Z) - WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.61972059246715]
本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。
透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文 参考訳(メタデータ) (2023-11-16T11:58:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。