論文の概要: External Data Extraction Attacks against Retrieval-Augmented Large Language Models
- arxiv url: http://arxiv.org/abs/2510.02964v1
- Date: Fri, 03 Oct 2025 12:53:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.387108
- Title: External Data Extraction Attacks against Retrieval-Augmented Large Language Models
- Title(参考訳): 検索型大規模言語モデルに対する外部データ抽出攻撃
- Authors: Yu He, Yifei Chen, Yiming Li, Shuo Shao, Leyi Qi, Boheng Li, Dacheng Tao, Zhan Qin,
- Abstract要約: RAGは、大規模言語モデル(LLM)を拡張するための重要なパラダイムとして登場した。
RAGは外部データ抽出攻撃(EDEA)の新たなリスクを導入している。
本研究は, EDEA を検索拡張 LLM に対して形式化する最初の総合的研究である。
- 参考スコア(独自算出の注目度): 70.47869786522782
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, RAG has emerged as a key paradigm for enhancing large language models (LLMs). By integrating externally retrieved information, RAG alleviates issues like outdated knowledge and, crucially, insufficient domain expertise. While effective, RAG introduces new risks of external data extraction attacks (EDEAs), where sensitive or copyrighted data in its knowledge base may be extracted verbatim. These risks are particularly acute when RAG is used to customize specialized LLM applications with private knowledge bases. Despite initial studies exploring these risks, they often lack a formalized framework, robust attack performance, and comprehensive evaluation, leaving critical questions about real-world EDEA feasibility unanswered. In this paper, we present the first comprehensive study to formalize EDEAs against retrieval-augmented LLMs. We first formally define EDEAs and propose a unified framework decomposing their design into three components: extraction instruction, jailbreak operator, and retrieval trigger, under which prior attacks can be considered instances within our framework. Guided by this framework, we develop SECRET: a Scalable and EffeCtive exteRnal data Extraction aTtack. Specifically, SECRET incorporates (1) an adaptive optimization process using LLMs as optimizers to generate specialized jailbreak prompts for EDEAs, and (2) cluster-focused triggering, an adaptive strategy that alternates between global exploration and local exploitation to efficiently generate effective retrieval triggers. Extensive evaluations across 4 models reveal that SECRET significantly outperforms previous attacks, and is highly effective against all 16 tested RAG instances. Notably, SECRET successfully extracts 35% of the data from RAG powered by Claude 3.7 Sonnet for the first time, whereas other attacks yield 0% extraction. Our findings call for attention to this emerging threat.
- Abstract(参考訳): 近年、RAGは大規模言語モデル(LLM)を拡張するための重要なパラダイムとして現れている。
外部から取得した情報を統合することで、RAGは時代遅れの知識や重要なことはドメインの専門知識の不足といった問題を緩和する。
有効ではあるが、RAGは外部データ抽出攻撃(EDEA)の新たなリスクを導入する。
これらのリスクは、RAGがプライベートな知識ベースを持つ特殊なLLMアプリケーションをカスタマイズするために使用される場合、特に深刻である。
これらのリスクを探求する初期の研究にもかかわらず、彼らはしばしば形式化されたフレームワーク、堅牢な攻撃性能、包括的な評価を欠いている。
本稿では,EDEA を検索強化 LLM に対して形式化する最初の総合的研究について述べる。
まず、EDEAを正式に定義し、それらの設計を3つのコンポーネント(抽出命令、ジェイルブレイク演算子、検索トリガ)に分解する統合フレームワークを提案します。
このフレームワークでガイドされたSECRET: a Scalable and EffeCtive exteRnal data extract aTtack。
特にSECRETは,(1) EDEAのための特別なジェイルブレイクプロンプトを生成する最適化としてLLMを用いた適応的最適化プロセス,(2) クラスタ中心のトリガ,(2) グローバルな探索と局所的なエクスプロイトを交互に行い,効果的な検索トリガを効率よく生成する適応的戦略を取り入れている。
4つのモデルにわたる大規模な評価の結果、SECRETは以前の攻撃よりも大幅に優れており、全16のRAGインスタンスに対して非常に効果的であることがわかった。
特に、SECRETは、初めてClaude 3.7 Sonnetを動力とするRAGからデータを35%抽出し、他の攻撃は0%抽出した。
私たちの発見は、この新たな脅威に注意を喚起する。
関連論文リスト
- Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries [42.768116999732776]
インプシット知識抽出攻撃(IKEA)は、良質なクエリを通してRAGシステム上で知識抽出を行う。
IKEAは、抽出効率の80%以上、攻撃成功率の90%を超えている。
論文 参考訳(メタデータ) (2025-05-21T12:04:42Z) - MM-PoisonRAG: Disrupting Multimodal RAG with Local and Global Poisoning Attacks [109.53357276796655]
Retrieval Augmented Generation (RAG) を備えたマルチモーダル大言語モデル(MLLM)
RAGはクエリ関連外部知識の応答を基盤としてMLLMを強化する。
この依存は、知識中毒攻撃(英語版)という、危険だが未発見の安全リスクを生じさせる。
本稿では,2つの攻撃戦略を持つ新しい知識中毒攻撃フレームワークMM-PoisonRAGを提案する。
論文 参考訳(メタデータ) (2025-02-25T04:23:59Z) - MARAGE: Transferable Multi-Model Adversarial Attack for Retrieval-Augmented Generation Data Extraction [6.917134562107388]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚に対する解決策を提供する。
既存のRAG抽出攻撃は、しばしば手作業によるプロンプトに依存し、その効果を制限している。
我々は、ターゲットRAGシステムに送信されたユーザクエリに付加された逆文字列を最適化するMARAGEと呼ばれるフレームワークを導入し、検索されたRAGデータを含む出力を発生させる。
論文 参考訳(メタデータ) (2025-02-05T00:17:01Z) - Feedback-Guided Extraction of Knowledge Base from Retrieval-Augmented LLM Applications [22.2065145193986]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の知識境界を拡張する
エージェントベースのブラックボックス攻撃であるCopyBreakRAGを提案する。
実験結果から,CopyBreakRAGは,チャンク抽出比において,最先端のブラックボックスアプローチを平均45%上回った。
論文 参考訳(メタデータ) (2024-11-21T13:18:03Z) - Data Extraction Attacks in Retrieval-Augmented Generation via Backdoors [15.861833242429228]
本稿では,RAGの知識データベースを対象としたデータ抽出攻撃について検討する。
従来のインジェクションベース抽出攻撃はLLMの命令追従能力に大きく依存していた。
筆者らは, LLM内のバックドアを作成するために, 微調整期間中に少量の有毒データを注入するバックドアRAGを提案する。
論文 参考訳(メタデータ) (2024-11-03T22:27:40Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
機密情報を含む匿名化は、幅広いアプリケーションにとって不可欠である。
既存の技術は、大規模言語モデルの再識別能力の新たな課題に直面している。
本稿では,プライバシ評価器,ユーティリティ評価器,最適化コンポーネントの3つの重要なコンポーネントで構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - "Glue pizza and eat rocks" -- Exploiting Vulnerabilities in Retrieval-Augmented Generative Models [74.05368440735468]
Retrieval-Augmented Generative (RAG)モデルにより大規模言語モデル(LLM)が強化される
本稿では,これらの知識基盤の開放性を敵が活用できるセキュリティ上の脅威を示す。
論文 参考訳(メタデータ) (2024-06-26T05:36:23Z) - REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA)
我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。
オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。