論文の概要: Feature-Augmented Transformers for Robust AI-Text Detection Across Domains and Generators
- arxiv url: http://arxiv.org/abs/2605.03969v1
- Date: Tue, 05 May 2026 16:52:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:44.047208
- Title: Feature-Augmented Transformers for Robust AI-Text Detection Across Domains and Generators
- Title(参考訳): ドメインとジェネレータ間のロバストAIテキスト検出のための機能拡張変換器
- Authors: Mohamed Mady, Johannes Reschke, Björn Schuller,
- Abstract要約: 我々はHC3 PLUSで変圧器ベースの検出器を訓練し、ホールドアウト検証におけるバランスの取れた精度を最大化することにより、単一判定閾値を校正する。
HC3 PLUS の領域内、マルチドメインのマルチジェネレータ M4 ベンチマークへのクロスデータセット転送、および外部 AI-Text-Detection-Pile 上での評価を行う。
我々の最良のモデル(DeBERTa-v3-base+FeatAttn)はM4上で85.9%のバランスの取れた精度を達成する。
- 参考スコア(独自算出の注目度): 0.10923877073891443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI-generated text is nowadays produced at scale across domains and heterogeneous generation pipelines, making robustness to distribution shift a central requirement for supervised binary detectors. We train transformer-based detectors on HC3 PLUS and calibrate a single decision threshold by maximising balanced accuracy on held-out validation; this threshold is then kept fixed for all downstream test distributions, revealing domain- and generator-dependent error asymmetries under shift. We evaluate in-domain on HC3 PLUS, under cross-dataset transfer to the multi-domain, multi-generator M4 benchmark, and on the external AI-Text-Detection-Pile. Although base models achieve near-ceiling in-domain performance (up to 99.5% balanced accuracy), performance under shift is brittle and strongly model-dependent. Feature augmentation via attention-based linguistic feature fusion improves transfer, with our best model (DeBERTa-v3-base+FeatAttn) achieving 85.9% balanced accuracy on M4. Multi-seed experiments confirm high stability. Under the same fixed-threshold protocol, our model outperforms strong zero-shot baselines by up to +7.22 points. Category-level ablations further show that readability and vocabulary features contribute most to robustness under shift. Overall, these results demonstrate that feature augmentation and a modern DeBERTa backbone significantly outperform earlier BERT/RoBERTa models, while the fixed-threshold protocol provides a more realistic and informative assessment of practical detector robustness.
- Abstract(参考訳): AI生成されたテキストは、現在、ドメインと異種生成パイプラインにまたがって大規模に生成されており、教師付きバイナリ検出器の中央要件である分散シフトの堅牢性を実現している。
我々はHC3 PLUS上でトランスフォーマーベースの検出器を訓練し、ホールドアウト検証におけるバランスの取れた精度を最大化し、単一決定しきい値のキャリブレーションを行い、このしきい値を下流の全てのテスト分布に固定し、シフト中のドメイン依存およびジェネレータ依存のエラー対称性を明らかにする。
HC3 PLUS の領域内、マルチドメインのマルチジェネレータ M4 ベンチマークへのクロスデータセット転送、および外部 AI-Text-Detection-Pile 上での評価を行う。
ベースモデルはドメイン内のほぼシーリング性能(99.5%のバランスの取れた精度)を達成するが、シフト時の性能は不安定でモデルに依存しない。
注意に基づく言語的特徴融合による特徴増強は、M4上で85.9%の精度で最良のモデル(DeBERTa-v3-base+FeatAttn)で伝達を改善する。
マルチシード実験では高い安定性が確認されている。
同じ固定閾値プロトコルの下では、我々のモデルは強いゼロショットベースラインを最大7.22ポイント上回る。
カテゴリーレベルのアブレーションは、可読性と語彙的特徴が、シフト中の堅牢性に最も寄与することを示している。
これらの結果から,機能拡張と最新のDeBERTaバックボーンはBERT/RoBERTaモデルよりも優れており,固定閾値プロトコルは実用的検出ロバスト性のより現実的で有益な評価を提供する。
関連論文リスト
- Beyond Perplexity: Character Distribution Signatures and the MDTA Benchmark for AI Text Detection [0.34998703934432673]
トレーニング不要のAIテキスト検出方法は、主にモデルログ確率に依存し、BinocularsやDNA-DetectLLMといったアプローチを通じて強力なパフォーマンスを達成する。
文字分布シグネチャに基づく代替検出信号を導入する。
我々は、大規模ドメインバランスのコーパスに基づいて訓練されたAIモデルが、人間がドメインに特化された分布を示す一方で、グローバルなキャラクタパターンを近似していることを示す理論的基盤を提供する。
論文 参考訳(メタデータ) (2026-05-03T00:10:15Z) - Detecting the Machine: A Comprehensive Benchmark of AI-Generated Text Detectors Across Architectures, Domains, and Adversarial Conditions [0.0]
既存のベンチマークでは、理想的な条件下で単一のデータセット上の1つの検出器を評価する。
本稿では,2つのコーパスにまたがる多様な検出手法を評価するベンチマークを提案する。
その結果, 変圧器モデルでは, ほぼ完全な分散性能が得られるが, ドメインシフト下では劣化することがわかった。
論文 参考訳(メタデータ) (2026-03-18T09:27:27Z) - Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols [123.73663884421272]
より強力な事前訓練モデルと改良された適応アルゴリズムによって、わずかなショット転送が革新されている。
FEWTRANSは10種類のデータセットを含む総合的なベンチマークである。
FEWTRANS をリリースすることにより,数発の転写学習研究において再現性の向上を合理化するための厳密な "ルーラー" の提供を目指す。
論文 参考訳(メタデータ) (2026-02-28T05:41:57Z) - T3: Test-Time Model Merging in VLMs for Zero-Shot Medical Imaging Analysis [15.624549727053475]
既存のモデルマージ技術は、様々な医学的手段で一貫した利益をもたらすことができません。
サンプル単位の係数を計算するバックプロパゲーションフリーフレームワークであるTest-Time Task Adaptive merging (T3)を導入する。
ドメイン内、ベース・ツー・ノーベル、および4つのモダリティにまたがる汚職にまたがる厳密な相互評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-31T08:05:40Z) - LuxVeri at GenAI Detection Task 3: Cross-Domain Detection of AI-Generated Text Using Inverse Perplexity-Weighted Ensemble of Fine-Tuned Transformer Models [0.8495482945981923]
逆パープレキシティ重み付けにより強化された微調整変圧器モデルのアンサンブルを提案し、多様なテキスト領域の分類精度を向上させる。
本研究は,非逆方向および逆方向のMGT検出において,逆パープレキシティに基づく重み付けが一般化と性能の向上に有効であることを示す。
論文 参考訳(メタデータ) (2025-01-21T06:46:55Z) - Cal-DETR: Calibrated Detection Transformer [67.75361289429013]
本稿では,Deformable-DETR,UP-DETR,DINOのキャリブレーション検出トランス(Cal-DETR)のメカニズムを提案する。
我々は、不確実性を利用してクラスロジットを変調する不確実性誘導ロジット変調機構を開発する。
その結果、Cal-DETRは、ドメイン内およびドメイン外の両方を校正する競合する列車時間法に対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-11-06T22:13:10Z) - Transformer-based approaches to Sentiment Detection [55.41644538483948]
テキスト分類のための4種類の最先端変圧器モデルの性能について検討した。
RoBERTa変換モデルは82.6%のスコアでテストデータセット上で最高のパフォーマンスを示し、品質予測に非常に推奨されている。
論文 参考訳(メタデータ) (2023-03-13T17:12:03Z) - ERNIE-SPARSE: Learning Hierarchical Efficient Transformer Through
Regularized Self-Attention [48.697458429460184]
情報ボトルネック感度と異なる注目トポロジ間の不整合の2つの要因がスパース変換器の性能に影響を及ぼす可能性がある。
本稿では,ERNIE-Sparseというモデルを提案する。
i) 局所情報とグローバル情報を逐次統一する階層スパース変換器(HST) と、(ii) 注意トポロジの異なる変換器の距離を最小化する自己注意正規化(SAR) の2つの特徴がある。
論文 参考訳(メタデータ) (2022-03-23T08:47:01Z) - Transformer Uncertainty Estimation with Hierarchical Stochastic
Attention [8.95459272947319]
本稿では,変圧器に不確実性推定機能を持たせるための新しい手法を提案する。
これは、価値と学習可能なセントロイドのセットに付随する階層的な自己注意を学ぶことで達成される。
我々は、ドメイン内(ID)とドメイン外(OOD)の両方のデータセットを用いて、2つのテキスト分類タスクでモデルを実証的に評価する。
論文 参考訳(メタデータ) (2021-12-27T16:43:31Z) - Bayesian Transformer Language Models for Speech Recognition [59.235405107295655]
トランスフォーマーで表現される最先端のニューラルネットワークモデル(LM)は非常に複雑である。
本稿では,トランスフォーマーLM推定のためのベイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-09T10:55:27Z) - Towards a Competitive End-to-End Speech Recognition for CHiME-6 Dinner
Party Transcription [73.66530509749305]
本稿では,難しい場合であっても,ハイブリッドベースラインに近い性能を示すエンドツーエンドアプローチについて論じる。
CTC-Attention と RNN-Transducer のアプローチと RNN と Transformer のアーキテクチャを比較し,解析する。
RNN-Transducerをベースとしたベストエンド・ツー・エンドモデルでは、ビームサーチの改善とともに、LF-MMI TDNN-F CHiME-6 Challengeのベースラインよりも品質が3.8%向上した。
論文 参考訳(メタデータ) (2020-04-22T19:08:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。