論文の概要: READER: Reasoning-Enhanced AI-Generated Text Detection
- arxiv url: http://arxiv.org/abs/2605.25281v2
- Date: Tue, 26 May 2026 16:00:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.0942
- Title: READER: Reasoning-Enhanced AI-Generated Text Detection
- Title(参考訳): ReaDER: 推論強化AI生成テキスト検出
- Authors: Pingfan Su, Kai Ye, Shijin Gong, Erhan Xu, Jin Zhu, Giulia Livieri, Chengchun Shi,
- Abstract要約: 我々は、人間/AIラベルと、その決定の証拠を記述した構造化された根拠の両方を出力する推論強化AIテキスト検出器であるREADERを提案する。
このアプローチの重要なコンポーネントは、合理性と判断のキュレートされた監視セットであるREADです。
READERは既存の検出器を一貫して上回り、高容量のLDMベースラインを誘導する。
- 参考スコア(独自算出の注目度): 9.295680825103183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in large language models (LLMs) have made it increasingly difficult to distinguish human-written text from AI-generated content. Many existing detectors train supervised neural classifiers that achieve strong in-distribution performance but are often opaque and can degrade substantially under distribution shift. We present READER, a reasoning-enhanced AI text detector that outputs both a human/AI label and a structured rationale describing the evidence for its decision. A key component of our approach is READ, a curated supervision set of rationales and verdicts. We fine-tune an LLM on READ to build READER, which reasons before detecting at inference time. Despite having only 1.5B parameters, READER consistently outperforms existing detectors as well as prompted, high-capacity LLM baselines (GPT-5.2, Gemini-3-Pro, and DeepSeek-V3.2), which are 100 to 1000 times larger in scale.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩により、AI生成コンテンツと人間によるテキストの区別がますます困難になっている。
多くの既存の検出器は、強力な分配性能を達成するが、しばしば不透明であり、分散シフトの下で著しく劣化する神経分類器を訓練する。
我々は、人間/AIラベルと、その決定の証拠を記述した構造化された根拠の両方を出力する推論強化AIテキスト検出器であるREADERを提案する。
このアプローチの重要なコンポーネントは、合理性と判断のキュレートされた監視セットであるREADです。
我々はREAD上にLEMを微調整してREADERを構築する。
1.5Bのパラメータしか持たなかったにもかかわらず、READERは既存の検出器と、100倍から1000倍の大きさの高容量LCMベースライン(GPT-5.2、Gemini-3-Pro、DeepSeek-V3.2)を一貫して上回っている。
関連論文リスト
- Base Models Look Human To AI Detectors [68.7723287560362]
ベースモデルから生成されたテキストは圧倒的に人間的であると判断されることが多いが、命令で調整されたテキストはそうではない。
提案するHumanization by Iterative Paraphrasing (HIP)は,ベースモデルをパラフラザーに最小限微調整し,反復的に適用する検出器非依存パイプラインである。
以上の結果から,現在の検出器は,機械生成テキストの概念よりも,命令チューニングやローカルコンテキストのアーティファクトを追跡していることが示唆された。
論文 参考訳(メタデータ) (2026-05-19T08:13:12Z) - Reasoning-Aware AIGC Detection via Alignment and Reinforcement [55.09684020007737]
REVEALは、分類の前に解釈可能な推論チェーンを生成するフレームワークである。
複数のベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-04-21T07:29:55Z) - Exons-Detect: Identifying and Amplifying Exonic Tokens via Hidden-State Discrepancy for Robust AI-Generated Text Detection [18.509745023735835]
我々は,Exon-Awareトークン再重み付けの観点から,AI生成テキスト検出のためのトレーニング不要な方法であるExons-Detectを提案する。
Exons-Detectは、二重モデル設定下で隠れ状態の不一致を測定して情報的エクソニックトークンを特定し、増幅し、その結果の重要重み付きトークンシーケンスから解釈可能な翻訳スコアを算出する。
論文 参考訳(メタデータ) (2026-03-26T03:12:19Z) - Diversity Boosts AI-Generated Text Detection [51.56484100374058]
DivEyeは、予備的な機能を使って、予測不可能がテキスト間でどのように変動するかをキャプチャする、新しいフレームワークである。
提案手法は、既存のゼロショット検出器を最大33.2%向上させ、微調整ベースラインとの競合性能を達成する。
論文 参考訳(メタデータ) (2025-09-23T10:21:22Z) - AuthorMist: Evading AI Text Detectors with Reinforcement Learning [4.806579822134391]
AuthorMistは、AI生成したテキストを人間ライクな文章に変換する、新しい強化学習ベースのシステムだ。
AuthorMistは,本来の意味を保ちながら,AI生成テキストの検出性を効果的に低減することを示す。
論文 参考訳(メタデータ) (2025-03-10T12:41:05Z) - IPAD: Inverse Prompt for AI Detection -- A Robust and Explainable LLM-Generated Text Detector [11.112793289424886]
大規模言語モデル (LLM) は、人間の書き起こしたテキストとLLM生成したテキストの区別を複雑にするテキスト生成において、人間レベルの流布を達成している。
既存の検出器は、オフ・オブ・ディストリビューション(OOD)データとアタックデータに弱いロバスト性を示す。
本稿では,入力テキストを生成可能な予測プロンプトを識別するPromptと,入力テキストが予測プロンプトと一致する確率を調べるDistinguisherからなる,新しいフレームワークであるIPADを提案する。
論文 参考訳(メタデータ) (2025-02-21T19:41:32Z) - Can AI-Generated Text be Reliably Detected? [50.95804851595018]
大規模言語モデル(LLM)は、様々なアプリケーションで非常によく機能します。
盗作、偽ニュースの発生、スパムなどの活動においてこれらのモデルが誤用される可能性があることは、彼らの責任ある使用に対する懸念を引き起こしている。
我々は、攻撃者の存在下で、これらのAIテキスト検出装置の堅牢性を強調テストする。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。