論文の概要: RefineRAG: Word-Level Poisoning Attacks via Retriever-Guided Text Refinement
- arxiv url: http://arxiv.org/abs/2604.07403v1
- Date: Wed, 08 Apr 2026 10:33:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.451537
- Title: RefineRAG: Word-Level Poisoning Attacks via Retriever-Guided Text Refinement
- Title(参考訳): RefineRAG:Retriever-Guided Text Refinementによるワードレベル中毒攻撃
- Authors: Ziye Wang, Guanyu Wang, Kailong Wang,
- Abstract要約: Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を大幅に強化する
PoisonedRAGのような既存の攻撃方法は、粗い粒度の分離・連結戦略のために検出可能である。
RefineRAGは, 毒素を総括的単語レベルでの精製問題として扱う新しいフレームワークである。
- 参考スコア(独自算出の注目度): 2.725904394644371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) significantly enhances Large Language Models (LLMs), but simultaneously exposes a critical vulnerability to knowledge poisoning attacks. Existing attack methods like PoisonedRAG remain detectable due to coarse-grained separate-and-concatenate strategies. To bridge this gap, we propose RefineRAG, a novel framework that treats poisoning as a holistic word-level refinement problem. It operates in two stages: Macro Generation produces toxic seeds guaranteed to induce target answers, while Micro Refinement employs a retriever-in-the-loop optimization to maximize retrieval priority without compromising naturalness. Evaluations on NQ and MSMARCO demonstrate that RefineRAG achieves state-of-the-art effectiveness, securing a 90% Attack Success Rate on NQ, while registering the lowest grammar errors and repetition rates among all baselines. Crucially, our proxy-optimized attacks successfully transfer to black-box victim systems, highlighting a severe practical threat.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) はLarge Language Models (LLM) を大幅に強化するが、同時に知識中毒攻撃に重大な脆弱性を暴露する。
PoisonedRAGのような既存の攻撃方法は、粗い粒度の分離・連結戦略のために検出可能である。
このギャップを埋めるため,本論文では,毒殺を総合的な単語レベル改善問題として扱う新しいフレームワークであるRefineRAGを提案する。
マクロジェネレーションは、ターゲットの答えを誘導することが保証される有毒な種子を生産し、マイクロリファインメントは、自然性を損なうことなく、検索優先度を最大化するために、レトリバー・イン・ザ・ループ最適化を採用する。
NQ と MSMARCO の評価は、RefineRAG が最先端の有効性を達成し、NQ に対して90% の攻撃成功率を確保し、全てのベースラインで最も低い文法誤差と繰り返し率を登録していることを示している。
重要なことに、プロキシ最適化攻撃はブラックボックスの被害者システムへの移行に成功し、深刻な現実的な脅威を浮き彫りにした。
関連論文リスト
- Disabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoning [14.419943772894754]
Retrieval-Augmented Generation (RAG)は,大規模言語モデル(LLM)の信頼性向上のための標準アプローチとなっている。
本稿では,現代のLSMの強力なテクスト自己補正能力(SCA)によって,このような攻撃を軽減できることを明らかにする。
我々は,新しい中毒パラダイムであるtextscDisarmRAG を導入し,レトリバー自体を妥協してSCAを抑止し,アタッカー・チョーゼン出力を強制する。
論文 参考訳(メタデータ) (2025-08-27T17:49:28Z) - The Silent Saboteur: Imperceptible Adversarial Attacks against Black-Box Retrieval-Augmented Generation Systems [101.68501850486179]
本稿では,RAGシステムに対する敵攻撃について検討し,その脆弱性を同定する。
このタスクは、ターゲット文書を検索する非知覚的な摂動を見つけることを目的としており、もともとはトップ$k$の候補セットから除外されていた。
本稿では、攻撃者とターゲットRAG間の相互作用を追跡する強化学習ベースのフレームワークであるReGENTを提案する。
論文 参考訳(メタデータ) (2025-05-24T08:19:25Z) - PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization [13.751251342738225]
大規模言語モデル(LLM)は、幅広いアプリケーションで顕著な性能を示している。
それらはまた、時代遅れの知識や幻覚への感受性のような固有の制限も示している。
近年の取り組みはRAGベースのLLMのセキュリティに重点を置いているが、既存の攻撃方法は3つの重大な課題に直面している。
本稿では,少数の有毒テキストを知識データベースに導入する新しい最適化型攻撃であるPrompt-RAGアタック(PR-アタック)を提案する。
論文 参考訳(メタデータ) (2025-04-10T13:09:50Z) - Practical Poisoning Attacks against Retrieval-Augmented Generation [9.320227105592917]
大規模言語モデル(LLM)は、印象的な自然言語処理能力を示しているが、幻覚や時代遅れの知識といった課題に直面している。
Retrieval-Augmented Generation (RAG)は、これらの問題を緩和するための最先端のアプローチとして登場した。
我々は、攻撃者が1つの有毒テキストだけを注入するRAGシステムに対する実用的な中毒攻撃であるCorruptRAGを提案する。
論文 参考訳(メタデータ) (2025-04-04T21:49:42Z) - Poisoned-MRAG: Knowledge Poisoning Attacks to Multimodal Retrieval Augmented Generation [71.32665836294103]
マルチモーダル検索強化世代(RAG)は視覚言語モデル(VLM)の視覚的推論能力を向上させる
本研究では,マルチモーダルRAGシステムに対する最初の知識中毒攻撃であるtextitPoisoned-MRAGを紹介する。
論文 参考訳(メタデータ) (2025-03-08T15:46:38Z) - MM-PoisonRAG: Disrupting Multimodal RAG with Local and Global Poisoning Attacks [104.50239783909063]
Retrieval Augmented Generation (RAG) を用いた多モーダル大規模言語モデルは、多モーダル質問応答のようなかなり高度なタスクを持つ。
この外部知識への依存は、知識中毒攻撃(英語版)という、危険だが未発見の安全リスクを引き起こす。
マルチモーダルRAGにおける知識中毒を体系的に設計する最初のフレームワークであるMM-PoisonRAGを提案する。
論文 参考訳(メタデータ) (2025-02-25T04:23:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。