論文の概要: SentinelRAG: Synthetic Sentinel Knowledge for RAG Database Copyright Protection
- arxiv url: http://arxiv.org/abs/2606.05787v1
- Date: Thu, 04 Jun 2026 07:19:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.6166
- Title: SentinelRAG: Synthetic Sentinel Knowledge for RAG Database Copyright Protection
- Title(参考訳): SentinelRAG:RAGデータベース著作権保護のための合成センチネル知識
- Authors: Tsun On Kwok, Xi Yang, Ki Sen Hung, Chang Liu, Yangqiu Song,
- Abstract要約: SentinelRAGは、スタイル一貫性はあるが架空の知識エントリをRAGデータベースに埋め込む。
我々の重要な洞察は、虚偽の実体を記述する合成知識は、正当なクエリーによって回収される可能性は低いということである。
本手法は,正規ユーザクエリに対する無視可能な干渉を維持しつつ,誤検出率を大幅に低減する。
- 参考スコア(独自算出の注目度): 44.7327467106684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protecting proprietary RAG databases from unauthorized redistribution is challenging: existing watermarking methods either inject fabricated relations between real entities, polluting the knowledge base with misinformation, or embed fragile lexical patterns that adversarial paraphrasing easily removes. We propose SentinelRAG, a watermarking framework that embeds style-consistent but fictitious knowledge entries into the RAG database. Our key insight is that synthetic knowledge describing fictitious entities is unlikely to be retrieved by legitimate queries, yet can be reliably triggered through targeted probes known only to the data owner. Experiments on four datasets ranging from 2.9k to 8.8M documents demonstrate that SentinelRAG achieves statistically significant detection $p < 10^{-5}$ across all tested configurations at only a 0.1% injection rate. Compared to the state-of-the-art, our method significantly reduces the false detection rate while maintaining negligible interference with legitimate user queries.
- Abstract(参考訳): 既存のウォーターマーキング手法は、実際の実体間の偽造関係を注入するか、誤情報で知識ベースを汚染するか、逆のパラフレーズが容易に取り除く脆弱な語彙パターンを埋め込むかのどちらかである。
本稿では,RAGデータベースにスタイル一貫性のある知識エントリを組み込んだ透かしフレームワークであるSentinelRAGを提案する。
我々の重要な洞察は、架空のエンティティを記述する合成知識は、正当なクエリによって検索される可能性は低いが、データ所有者にのみ知られるターゲットプローブによって確実にトリガーできるということである。
2.9kから8.8Mまでの4つのデータセットの実験では、SentinelRAGが統計的に重要な検出$p < 10^{-5}$をわずか0.1%のインジェクション率で全てのテスト構成で達成していることが示された。
提案手法は,最先端技術と比較して,正規ユーザクエリに対する無視可能な干渉を維持しつつ,誤検出率を大幅に低減する。
関連論文リスト
- FlowGuard: Flow Matching for Identity-Independent Detection of Data-Free Model Stealing Attacks on Energy System Intrusion Detection Systems [0.0]
FlowGuardは、入ってくるクエリをアウト・オブ・ディストリビューション(OOD)として分類するフローマッチングに基づく、IDに依存しない防御である。
このアプローチは、データフリーモデル盗難攻撃のために合成的に生成されたクエリが、実際のネットワークトラフィックよりも低次元の多様体を占有しているという事実を生かしている。
我々は,MAZE と DisGUIDE 攻撃を用いたPRADA と FDINet に対して,単サイクルで分散した (100-client Sybil) 設定で評価した。
論文 参考訳(メタデータ) (2026-06-02T10:18:45Z) - CyberCane: Neuro-Symbolic RAG for Privacy-Preserving Phishing Detection with Formal Ontology Reasoning [14.077535013043311]
CyberCaneは、ニューロシンボリックなフレームワークの統合である。
プライバシー保護による決定論的象徴的分析。
検索増強世代(RAG)
PhishOntは、フォーマルな推論チェーンを通じて検証可能な攻撃分類を可能にするOWLである。
論文 参考訳(メタデータ) (2026-04-26T07:08:00Z) - AEGIS: From Clues to Verdicts -- Graph-Guided Deep Vulnerability Reasoning via Dialectics and Meta-Auditing [9.271196825503417]
大きな言語モデル(LLM)は、脆弱性検出にますます採用されているが、その推論は基本的には正しくない。
AEGISは、未解決の投機から、クローズドな事実ベース上の法医学的検証へ、検出をシフトする新しいマルチエージェントフレームワークである。
これは、主要なベースラインと比較して偽陽性率を最大54.40%削減し、1サンプルあたりの平均コストはタスク固有のトレーニングなしで0.09ドルである。
論文 参考訳(メタデータ) (2026-03-21T04:12:04Z) - ProtegoFed: Backdoor-Free Federated Instruction Tuning with Interspersed Poisoned Data [50.142067708131826]
Federated Instruction Tuning (FIT)は、複数の組織(組織)にまたがる大規模な言語モデルの、プライベートなインストラクションの共有を必要とせずに、クロスサイロ環境での協調的なインストラクションチューニングを可能にする。
最近の研究では、有毒なサンプルが現実世界のデータセットに広範に埋め込まれており、たとえクライアントが良心的であっても、すべてのクライアントに分散している可能性が示唆されている。
ProtegoFedは、トレーニング中にクライアント間で汚染されたデータを正確に検出・浄化・分散する最初のバックドアフリーFITフレームワークである。
論文 参考訳(メタデータ) (2026-02-28T07:25:32Z) - Dataset Protection via Watermarked Canaries in Retrieval-Augmented LLMs [67.0310240737424]
本稿では,テキストデータセットの所有権を保護し,RA-LLMによる不正使用を効果的に検出するための新しいアプローチを提案する。
提案手法では,IPデータセットに特別に設計されたカナリア文書を挿入することにより,元のデータを完全に変更することなく保護する。
検出プロセス中、カナリア文書をクエリし、RA-LLMの応答を分析することにより、不正使用を識別する。
論文 参考訳(メタデータ) (2025-02-15T04:56:45Z) - Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation [18.098228823748617]
本稿では,RAGデータストア内の文書を対象としたメンバシップ推論手法であるInterrogation Attack (IA)を提案する。
ステルス性を維持しながら、たった30クエリで推論に成功したことを実証します。
我々は,様々なRAG構成に対する事前推論攻撃に対して,TPR@1%FPRの2倍の改善が観察された。
論文 参考訳(メタデータ) (2025-02-01T04:01:18Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。