論文の概要: RAR: Setting Knowledge Tripwires for Retrieval Augmented Rejection
- arxiv url: http://arxiv.org/abs/2505.13581v1
- Date: Mon, 19 May 2025 15:41:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.459957
- Title: RAR: Setting Knowledge Tripwires for Retrieval Augmented Rejection
- Title(参考訳): RAR:検索拒否のための知識トリップワイヤの設定
- Authors: Tommaso Mario Buonocore, Enea Parimbelli,
- Abstract要約: 本稿では、モデルリトレーニングなしで安全でないユーザクエリを動的に拒否する新しい手法であるRetrieval Augmented Rejection (RAR)を提案する。
悪意のある文書をベクターデータベースに戦略的に挿入し、マーキングすることにより、これらの文書が検索されたときに有害な要求を識別および拒否することができる。
- 参考スコア(独自算出の注目度): 0.1657441317977376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Content moderation for large language models (LLMs) remains a significant challenge, requiring flexible and adaptable solutions that can quickly respond to emerging threats. This paper introduces Retrieval Augmented Rejection (RAR), a novel approach that leverages a retrieval-augmented generation (RAG) architecture to dynamically reject unsafe user queries without model retraining. By strategically inserting and marking malicious documents into the vector database, the system can identify and reject harmful requests when these documents are retrieved. Our preliminary results show that RAR achieves comparable performance to embedded moderation in LLMs like Claude 3.5 Sonnet, while offering superior flexibility and real-time customization capabilities, a fundamental feature to timely address critical vulnerabilities. This approach introduces no architectural changes to existing RAG systems, requiring only the addition of specially crafted documents and a simple rejection mechanism based on retrieval results.
- Abstract(参考訳): 大規模言語モデル(LLM)のコンテンツモデレーションは依然として大きな課題であり、新たな脅威に迅速に対応できる柔軟性と適応性を備えたソリューションを必要としている。
本稿では,RAR(Retrieval Augmented Rejection)について紹介する。この手法は,RAG(Research-augmented Generation)アーキテクチャを利用して,モデルの再トレーニングを伴わずに,安全でないユーザクエリを動的に拒否する。
悪意のある文書をベクターデータベースに戦略的に挿入し、マーキングすることにより、これらの文書が検索されたときに有害な要求を識別および拒否することができる。
我々の予備的な結果は、RARがClaude 3.5 SonnetのようなLLMの組み込みモデレーションに匹敵する性能を達成し、優れた柔軟性とリアルタイムカスタマイズ機能を提供し、重要な脆弱性にタイムリーに対処する基本機能であることを示している。
提案手法は既存のRAGシステムにアーキテクチャ上の変更を加えることなく,検索結果に基づいて,特殊な文書と単純な拒絶機構を付加するだけでよい。
関連論文リスト
- DynamicRAG: Leveraging Outputs of Large Language Model as Feedback for Dynamic Reranking in Retrieval-Augmented Generation [23.060355911225923]
リランカは、生成品質と説明可能性を高めるために、検索した文書の精錬において重要な役割を果たす。
本稿では,リランカが検索した文書の順序と数の両方を動的に調整する新しいRAGフレームワークであるDynamicRAGを提案する。
論文 参考訳(メタデータ) (2025-05-12T05:19:01Z) - Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.405085773954596]
Retrieval-Augmented Generation (RAG) は、大規模言語モデル幻覚を緩和するための強力なアプローチとして登場した。
既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。
本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:56:20Z) - Cognitive-Aligned Document Selection for Retrieval-augmented Generation [2.9060210098040855]
本稿では,クエリを動的に更新し,高品質で信頼性の高い検索文書をフィルタリングするGGatrievalを提案する。
ユーザクエリを構文コンポーネントにパースし、検索したドキュメントときめ細かいグラウンドアライメントを実行する。
提案手法では,検索した文書をフィルタリングするための新しい基準を導入し,ターゲット情報を取得するための人的戦略を密にエミュレートする。
論文 参考訳(メタデータ) (2025-02-17T13:00:15Z) - Unanswerability Evaluation for Retrieval Augmented Generation [74.3022365715597]
UAEval4RAGは、RAGシステムが解答不能なクエリを効果的に処理できるかどうかを評価するために設計されたフレームワークである。
我々は、6つの未解決カテゴリを持つ分類を定義し、UAEval4RAGは、多様で挑戦的なクエリを自動的に合成する。
論文 参考訳(メタデータ) (2024-12-16T19:11:55Z) - "Glue pizza and eat rocks" -- Exploiting Vulnerabilities in Retrieval-Augmented Generative Models [74.05368440735468]
Retrieval-Augmented Generative (RAG)モデルにより大規模言語モデル(LLM)が強化される
本稿では,これらの知識基盤の開放性を敵が活用できるセキュリティ上の脅威を示す。
論文 参考訳(メタデータ) (2024-06-26T05:36:23Z) - RaFe: Ranking Feedback Improves Query Rewriting for RAG [83.24385658573198]
アノテーションを使わずにクエリ書き換えモデルをトレーニングするためのフレームワークを提案する。
公開されているリランカを活用することで、フィードバックはリライトの目的とよく一致します。
論文 参考訳(メタデータ) (2024-05-23T11:00:19Z) - REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA)
我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。
オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z) - Corrective Retrieval Augmented Generation [36.04062963574603]
Retrieval-augmented Generation (RAG) は、検索された文書の関連性に大きく依存しており、検索が失敗した場合のモデルがどのように振る舞うかについての懸念を提起する。
生成の堅牢性を改善するために,CRAG(Corrective Retrieval Augmented Generation)を提案する。
CRAGはプラグアンドプレイであり、様々なRAGベースのアプローチとシームレスに結合できる。
論文 参考訳(メタデータ) (2024-01-29T04:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。