論文の概要: Cross-Prompt Generalization in Detecting AI-Generated Fake News Using Interpretable Linguistic Features
- arxiv url: http://arxiv.org/abs/2606.04199v1
- Date: Tue, 02 Jun 2026 20:33:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.375074
- Title: Cross-Prompt Generalization in Detecting AI-Generated Fake News Using Interpretable Linguistic Features
- Title(参考訳): 解釈可能な言語特徴を用いたAI生成フェイクニュースの検出におけるクロスプロンプト一般化
- Authors: Aya Vera-Jimenez, Samuel Jaeger, Calvin Ibenye, Dhrubajyoti Ghosh,
- Abstract要約: 本稿では,異なるプロンプトで生成されたAI生成記事の3つのデータセットを用いて,偽ニュース検出におけるクロスプロンプト一般化について検討する。
語彙の多様性,可読性,感情に基づく特徴を捉えた解釈可能な言語特徴を抽出する。
特徴分布の分析により、AI生成したテキストは語彙の多様性を高め、読みやすさを低下させ、全体のデータセットと比較して感情的な強度を大幅に低下させることが示された。
- 参考スコア(独自算出の注目度): 0.13999481573773068
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The increasing use of large language models has raised concerns about the spread of AI-generated fake news, particularly under varying prompting strategies. Most existing detection models are trained and evaluated under a single generation setting, leaving their ability to generalize across unseen prompts unclear. In this study, we investigate cross-prompt generalization in fake news detection using three datasets of AI-generated articles produced under distinct prompts, combined with real news articles. We extract interpretable linguistic features capturing lexical diversity, readability, and emotion-based characteristics and evaluate a random forest classifier under a cross-prompt framework, where models trained on one prompt are tested on another. Across all six train-test combinations, performance remains consistently high, with AUC values ranging from 0.988 to 1.000. Analysis of feature distributions shows that AI-generated text exhibits increased lexical diversity, reduced readability, and substantially lower emotional intensity compared to the overall dataset, with variations across prompts. Despite these distributional shifts, the classifier maintains strong performance, indicating that these features capture stable properties of AI-generated text that generalize across prompting strategies. These findings suggest that feature-based approaches can provide robust detection of AI-generated fake news under prompt variability.
- Abstract(参考訳): 大規模な言語モデルの使用の増加は、AI生成のフェイクニュースの拡散、特に様々なプロンプト戦略の下での懸念を引き起こしている。
既存の検出モデルは、単一の世代設定でトレーニングされ、評価され、目に見えないプロンプトをまたいで一般化する能力は不明確のままである。
本研究では,異なるプロンプトで生成されたAI生成記事の3つのデータセットと実ニュース記事を組み合わせた偽ニュース検出におけるクロスプロンプト一般化について検討した。
我々は、語彙の多様性、可読性、感情に基づく特徴を抽出した解釈可能な言語特徴を抽出し、クロスプロンプトの枠組みの下でランダムな森林分類器を評価し、あるプロンプトで訓練されたモデルを別のプロンプトでテストする。
6つの列車とテストの組合せの中で、AUCの値は0.988から1.000まで、常に高い性能を保っている。
特徴分布の分析により、AI生成したテキストは、レキシカルな多様性の増加、可読性の低下、全体のデータセットと比較して感情的な強度の低下を示す。
これらの分散シフトにもかかわらず、分類器は強力な性能を維持しており、これらの特徴は、プロンプト戦略をまたいだ一般化されたAI生成テキストの安定した特性を捉えていることを示している。
これらの結果は、特徴に基づくアプローチが、即時変動の下でAIが生成した偽ニュースを堅牢に検出することを可能にすることを示唆している。
関連論文リスト
- Findings of the Counter Turing Test: AI-Generated Text Detection [23.358538027776877]
本稿では、最先端のAI生成テキスト検出技術について包括的に分析する。
対数チューリングテスト(CT2)の共有タスクを通じて、その有効性を評価する。
トップパフォーマンスチームは、微調整されたトランスフォーマーモデル、アンサンブル学習、ハイブリッド検出アプローチを活用した。
論文 参考訳(メタデータ) (2026-05-20T06:01:17Z) - Human vs. Machine Deception: Distinguishing AI-Generated and Human-Written Fake News Using Ensemble Learning [0.13999481573773068]
本研究では,人書きニュースとAI生成フェイクニュースの言語的,構造的,感情的差異について検討する。
文書レベルの特徴表現は、文構造、語彙の多様性、句読点パターン、可読性指標、感情に基づく特徴を用いて構成される。
その結果,可読性に基づく特徴が最も有意義な予測因子として出現し,信頼性と一貫した分類性能が示された。
論文 参考訳(メタデータ) (2026-04-10T23:51:28Z) - Why AI-Generated Text Detection Fails: Evidence from Explainable AI Beyond Benchmark Accuracy [0.9169660430821364]
本稿では,言語機能工学,機械学習,説明可能なAI技術を統合するフレームワークを提案する。
SHAPに基づく説明を用いて、最も影響力のある特徴がデータセットによって著しく異なることを示す。
この知識は、さまざまな設定で堅牢なAI検出器を構築するのに役立ちます。
論文 参考訳(メタデータ) (2026-03-24T12:46:15Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - Diversity Boosts AI-Generated Text Detection [51.56484100374058]
DivEyeは、予備的な機能を使って、予測不可能がテキスト間でどのように変動するかをキャプチャする、新しいフレームワークである。
提案手法は、既存のゼロショット検出器を最大33.2%向上させ、微調整ベースラインとの競合性能を達成する。
論文 参考訳(メタデータ) (2025-09-23T10:21:22Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.419940585826744]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - Detecting Machine-Generated Long-Form Content with Latent-Space Variables [54.07946647012579]
既存のゼロショット検出器は主に、現実世界のドメインシフトに弱いトークンレベルの分布に焦点を当てている。
本稿では,イベント遷移などの抽象的要素を機械対人文検出の鍵となる要因として組み込んだ,より堅牢な手法を提案する。
論文 参考訳(メタデータ) (2024-10-04T18:42:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。