論文の概要: RADAR: Retrieval-Augmented Detector with Adversarial Refinement for Robust Fake News Detection
- arxiv url: http://arxiv.org/abs/2601.03981v1
- Date: Wed, 07 Jan 2026 14:52:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.661069
- Title: RADAR: Retrieval-Augmented Detector with Adversarial Refinement for Robust Fake News Detection
- Title(参考訳): RADAR:ロバストフェイクニュース検出のための逆リファインメント付き検索拡張検出器
- Authors: Song-Duo Ma, Yi-Hung Liu, Hsin-Yu Lin, Pin-Yu Chen, Hong-Yan Huang, Shau-Yung Hsu, Yun-Nung Chen,
- Abstract要約: 本稿では,強靭な偽ニュース検出のための対角補正機能を備えた検索拡張検出器RADARを提案する。
提案手法では,現実の物品を現実の摂動で書き直すジェネレータを用いて,高密度経路探索によるクレームの検証を行う軽量検出器と組み合わせる。
- 参考スコア(独自算出の注目度): 50.073924438848316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To efficiently combat the spread of LLM-generated misinformation, we present RADAR, a retrieval-augmented detector with adversarial refinement for robust fake news detection. Our approach employs a generator that rewrites real articles with factual perturbations, paired with a lightweight detector that verifies claims using dense passage retrieval. To enable effective co-evolution, we introduce verbal adversarial feedback (VAF). Rather than relying on scalar rewards, VAF issues structured natural-language critiques; these guide the generator toward more sophisticated evasion attempts, compelling the detector to adapt and improve. On a fake news detection benchmark, RADAR achieves 86.98% ROC-AUC, significantly outperforming general-purpose LLMs with retrieval. Ablation studies confirm that detector-side retrieval yields the largest gains, while VAF and few-shot demonstrations provide critical signals for robust training.
- Abstract(参考訳): LLMが生成する誤報の拡散を効果的に対処するために, 対角補正機能を備えた検索拡張検出器RADARを, 堅牢な偽ニュース検出のために提案する。
提案手法では,現実の物品を現実の摂動で書き直すジェネレータを用いて,高密度経路探索によるクレームの検証を行う軽量検出器と組み合わせる。
効果的な共進化を実現するために,言語対立フィードバック(VAF)を導入する。
VAFはスカラーの報酬に頼るのではなく、自然言語の批判を構造化し、より洗練された回避の試みに向けてジェネレータを誘導し、検出器に適応し改善するよう促した。
偽ニュース検出のベンチマークでは、RADARは86.98%のROC-AUCを達成し、検索による汎用LLMよりも大幅に優れていた。
アブレーション研究により、検出器側での検索が最大のゲインを得るのに対し、VAFと数発のデモは堅牢なトレーニングのための重要な信号を提供する。
関連論文リスト
- Injecting External Knowledge into the Reasoning Process Enhances Retrieval-Augmented Generation [41.28340070471627]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を知識集約タスクの外部知識で拡張するために広く採用されている。
RAGの有効性は、しばしばノイズ(低品質)の回復経路の存在によって損なわれる。
本稿では,RAGの雑音に対する認識・抵抗能力を高めるため,パッセージインジェクションを提案する。
論文 参考訳(メタデータ) (2025-07-25T14:43:31Z) - Effective and Efficient Adversarial Detection for Vision-Language Models via A Single Vector [97.92369017531038]
Diverse hArmful Responses (RADAR) を用いた新しい laRge-scale Adervsarial 画像データセットを構築した。
そこで我々は,視覚言語モデル (VLM) の隠れ状態から抽出した1つのベクトルを利用して,入力中の良質な画像に対して対向画像を検出する,新しいiN時間埋め込み型AdveRSarial Image Detectction (NEARSIDE) 法を開発した。
論文 参考訳(メタデータ) (2024-10-30T10:33:10Z) - Real-time Factuality Assessment from Adversarial Feedback [11.742257531343814]
本研究では,従来の情報源からの情報の事実性を評価するための評価が,LCM検出器の時間経過とともに高い精度をもたらすことを示す。
適切な事実性評価データセットは、関連する証拠を検索して読み取ることによって、現在の出来事を推論するモデルの能力をテストすべきである、と我々は主張する。
論文 参考訳(メタデータ) (2024-10-18T17:47:11Z) - RADAR: Robust AI-Text Detection via Adversarial Learning [69.5883095262619]
RADARはパラフラザーと検出器の対向訓練に基づいている。
パラフレーズの目標は、AIテキスト検出を避けるために現実的なコンテンツを生成することである。
RADARは検出器からのフィードバックを使ってパラフラザーを更新する。
論文 参考訳(メタデータ) (2023-07-07T21:13:27Z) - MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。
一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。
本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文 参考訳(メタデータ) (2023-03-26T21:12:36Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。