論文の概要: Breaking the Generator Barrier: Disentangled Representation for Generalizable AI-Text Detection
- arxiv url: http://arxiv.org/abs/2604.13692v1
- Date: Wed, 15 Apr 2026 10:14:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.482132
- Title: Breaking the Generator Barrier: Disentangled Representation for Generalizable AI-Text Detection
- Title(参考訳): ジェネレータを壊す:汎用AIテキスト検出のためのアンタングル表現
- Authors: Xiao Pu, Zepeng Cheng, Lin Yuan, Yu Wu, Xiuli Bi,
- Abstract要約: 大規模言語モデル(LLM)は、人間の文章に近づきつつあるテキストを生成する。
新しいモデルが急速に出現し、そのようなショートカットの堅牢性が低下する。
本稿では,AI検出のセマンティクスをジェネレータ対応のアーティファクトから切り離す,段階的に構造化されたフレームワークを提案する。
- 参考スコア(独自算出の注目度): 17.88697261224505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As large language models (LLMs) generate text that increasingly resembles human writing, the subtle cues that distinguish AI-generated content from human-written content become increasingly challenging to capture. Reliance on generator-specific artifacts is inherently unstable, since new models emerge rapidly and reduce the robustness of such shortcuts. This generalizes unseen generators as a central and challenging problem for AI-text detection. To tackle this challenge, we propose a progressively structured framework that disentangles AI-detection semantics from generator-aware artifacts. This is achieved through a compact latent encoding that encourages semantic minimality, followed by perturbation-based regularization to reduce residual entanglement, and finally a discriminative adaptation stage that aligns representations with task objectives. Experiments on MAGE benchmark, covering 20 representative LLMs across 7 categories, demonstrate consistent improvements over state-of-the-art methods, achieving up to 24.2% accuracy gain and 26.2% F1 improvement. Notably, performance continues to improve as the diversity of training generators increases, confirming strong scalability and generalization in open-set scenarios. Our source code will be publicly available at https://github.com/PuXiao06/DRGD.
- Abstract(参考訳): 大規模言語モデル(LLM)が人間の文章に近づきつつあるテキストを生成するにつれ、AI生成したコンテンツと人間が書いたコンテンツとを区別する微妙な手がかりは、キャプチャがますます困難になっている。
新しいモデルが急速に出現し、そのようなショートカットの堅牢性が低下するため、ジェネレータ固有のアーティファクトへの信頼性は本質的に不安定である。
これにより、見えないジェネレータをAIテキスト検出の中心的で困難な問題として一般化する。
この課題に対処するため,我々は,AI検出セマンティクスをジェネレータ対応のアーティファクトから切り離す,段階的に構造化されたフレームワークを提案する。
これは、意味的最小性を奨励するコンパクトな潜時符号化、続いて摂動に基づく正規化により残留絡み込みを減少させ、最後に、表現をタスク目的と整列する識別適応段階によって達成される。
MAGEベンチマークの実験は、7つのカテゴリにまたがる20の代表的なLCMをカバーし、最先端の手法よりも一貫した改善を示し、24.2%の精度向上と26.2%のF1の改善を達成した。
特に、トレーニングジェネレータの多様性が向上するにつれて、パフォーマンスが向上し続けており、オープンセットシナリオにおける強力なスケーラビリティと一般化が確認されている。
ソースコードはhttps://github.com/PuXiao06/DRGD.comで公開されます。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - OmniVL-Guard: Towards Unified Vision-Language Forgery Detection and Grounding via Balanced RL [63.388513841293616]
既存の偽造検出手法は、現実世界の誤報に多いインターリーブされたテキスト、画像、ビデオを扱うのに失敗する。
このギャップを埋めるため,本論文では,オムニバス・ビジョン言語による偽造検出と接地のための統一フレームワークの開発を目標としている。
我々は、OmniVL-Guardという、オムニバス視覚言語による偽造検出と接地のためのバランスの取れた強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-11T09:41:36Z) - When AI Settles Down: Late-Stage Stability as a Signature of AI-Generated Text Detection [15.739137990102991]
我々は120k以上のテキストサンプルを分析し、レイトステージのボラティリティの低下を明らかにする: AI生成されたテキストは、生成が進むにつれて、ログの確率変動を急速に安定化させる。
先進的分散と局所ボラティリティの2つの単純な特徴を提案する。
論文 参考訳(メタデータ) (2026-01-08T11:11:00Z) - Scaling Up AI-Generated Image Detection via Generator-Aware Prototypes [15.99138549265524]
GAPL(Generator-Aware Prototype Learning)は、構造化学習パラダイムで表現を制約するフレームワークである。
GAPLは最先端の性能を達成し、多様なGANおよび拡散型ジェネレータにおいて優れた検出精度を示す。
論文 参考訳(メタデータ) (2025-12-15T04:58:08Z) - Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.419940585826744]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - Learning to Rewrite: Generalized LLM-Generated Text Detection [19.9477991969521]
大規模言語モデル(LLM)は、非現実的コンテンツを生成し、大規模に偽情報を拡散する際に大きなリスクをもたらす。
本稿では、未知の領域に例外的な一般化を伴うAI生成テキストを検出するための新しいフレームワークであるLearning2Rewriteを紹介する。
論文 参考訳(メタデータ) (2024-08-08T05:53:39Z) - Are AI-Generated Text Detectors Robust to Adversarial Perturbations? [9.001160538237372]
AI生成テキスト(AIGT)の現在の検出器は、敵の摂動に対する堅牢性を欠いている。
本稿では,既存のAIGT検出手法の堅牢性について検討し,新しい検出器であるシームズキャリブレーション・リコンストラクション・ネットワーク(SCRN)を導入する。
SCRNは、テキストからのノイズの追加と除去に再構成ネットワークを使用し、局所的な摂動に対して堅牢な意味表現を抽出する。
論文 参考訳(メタデータ) (2024-06-03T10:21:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。