論文の概要: On the Salience of Low-Probability Tokens for AI-Generated Text Detection: A Multiscale Uncertainty Perspective
- arxiv url: http://arxiv.org/abs/2606.02158v1
- Date: Mon, 01 Jun 2026 12:21:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.990532
- Title: On the Salience of Low-Probability Tokens for AI-Generated Text Detection: A Multiscale Uncertainty Perspective
- Title(参考訳): AIによるテキスト検出のための低確率トークンのサプライアンスについて:マルチスケール不確実性の観点から
- Authors: Yikai Guo, Bin Wang, Xilai Fan, Wenjun Ke, Haoran Luo,
- Abstract要約: 不確実性は情報的低確率トークンに焦点を当てたマルチスケール不確実性推定器である。
低確率トークンのログ確率を平均化することで、ボイラープレートの優位性を緩和する。
これはレニイエントロピーを通じて、この低確率領域の分布形状を捉え、脆さを減少させる。
- 参考スコア(独自算出の注目度): 19.794084116453146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI-generated text increasingly blends with human writing, raising practical risks such as misinformation, academic misuse, and corpora contamination. While statistical detectors are appealing for efficiency and generalization, they suffer from two key limitations. (i) Boilerplate dominance, boilerplate tokens shared across human and LLM writing can overwhelm discriminative signals. (ii) Brittle point estimates, relying on a single probability score yields unstable decisions under adversarial manipulations. To address these issues, we propose Uncertainty, a multiscale uncertainty estimator that focuses on informative low-probability tokens, which more clearly expose distributional discrepancies. Locally, it alleviates boilerplate dominance by averaging the log-probabilities of low-probability tokens; globally, it reduces brittleness by capturing the distributional shape of this low-probability region via Rényi entropy. We further extend the detector to Uncertainty++ via conditional independent sampling, yielding a more stable uncertainty estimation. Experiments across seven datasets and sixteen LLMs demonstrate high effectiveness, generalization, and robustness. Our code is available at https://github.com/guoyikai2000/Uncertainty-AIGT.
- Abstract(参考訳): AI生成されたテキストは、人間の文章と混同され、誤情報、学術的誤用、コーパス汚染などの実践的なリスクが高まる。
統計検出器は効率と一般化をアピールしているが、それらは2つの重要な限界に悩まされている。
一 ボイラープレートのトークンを人体とLLMで共有することにより、識別シグナルを圧倒することができる。
2) 1つの確率スコアに依存する脆点推定は、敵の操作の下で不安定な決定をもたらす。
これらの問題に対処するために,情報的低確率トークンに着目したマルチスケール不確実性推定器Uncertaintyを提案する。
局所的には、低確率トークンの対数確率を平均化することでボイラープレート支配を緩和し、世界中のレニイエントロピーを通じてこの低確率領域の分布形状を捉えて脆さを減少させる。
さらに、条件付き独立サンプリングにより不確実性++に検出器を拡張し、より安定した不確実性推定を行う。
7つのデータセットと16のLSMにわたる実験は、高い有効性、一般化、堅牢性を示している。
私たちのコードはhttps://github.com/guoyikai2000/Uncertainty-AIGTで公開されています。
関連論文リスト
- Exons-Detect: Identifying and Amplifying Exonic Tokens via Hidden-State Discrepancy for Robust AI-Generated Text Detection [18.509745023735835]
我々は,Exon-Awareトークン再重み付けの観点から,AI生成テキスト検出のためのトレーニング不要な方法であるExons-Detectを提案する。
Exons-Detectは、二重モデル設定下で隠れ状態の不一致を測定して情報的エクソニックトークンを特定し、増幅し、その結果の重要重み付きトークンシーケンスから解釈可能な翻訳スコアを算出する。
論文 参考訳(メタデータ) (2026-03-26T03:12:19Z) - PredictaBoard: Benchmarking LLM Score Predictability [50.47497036981544]
大きな言語モデル(LLM)は予測不能に失敗することが多い。
これは、安全なデプロイメントを保証する上で、大きな課題となる。
PredictaBoardは,新しいベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-02-20T10:52:38Z) - Uncertainty is Fragile: Manipulating Uncertainty in Large Language Models [79.76293901420146]
大規模言語モデル(LLM)は、出力の信頼性が不可欠である様々な高い領域で採用されている。
本研究では,不確実性推定の脆弱性を調査し,攻撃の可能性を探る。
攻撃者がLSMにバックドアを埋め込むことができ、入力中の特定のトリガーによって起動されると、最終的な出力に影響を与えることなくモデルの不確実性を操作できることを示す。
論文 参考訳(メタデータ) (2024-07-15T23:41:11Z) - Token-Level Adversarial Prompt Detection Based on Perplexity Measures
and Contextual Information [67.78183175605761]
大規模言語モデルは、敵の迅速な攻撃に影響を受けやすい。
この脆弱性は、LLMの堅牢性と信頼性に関する重要な懸念を浮き彫りにしている。
トークンレベルで敵のプロンプトを検出するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-20T03:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。