論文の概要: Privacy Policy Enforcement Guardrails for Data-Sensitive Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2605.17034v1
- Date: Sat, 16 May 2026 15:08:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.503646
- Title: Privacy Policy Enforcement Guardrails for Data-Sensitive Retrieval-Augmented Generation
- Title(参考訳): データ高感度検索型世代のためのプライバシポリシ強化ガードレール
- Authors: Osama Zafar, Alexander Nemecek, Yiqian Zhang, Wenbiao Li, Debargha Ganguly, Vikash Singh, Vipin Chaudhary, Erman Ayday,
- Abstract要約: PIIフィルタは、個人を集合的に識別する非規制属性クラスタなど、RAGシステムにおけるコンテキストデータの漏洩を見逃すことが多い。
本稿では,融合したテキスト埋め込みを持つ2つの一級密度推定器と,アウト・オブ・ディストリビューション・インプットのための断続領域を用いたプライバシポリシ強化フレームワークを提案する。
提案するT3+OCSVM検出器は,安全性とバウンダリラインセーフなデータに基づいてトレーニングされ,バウンダリラインAUROCの0.93+を実現し,偽陽性を44~55ポイント削減し,ミリ秒遅れを抑える。
- 参考スコア(独自算出の注目度): 40.44980598761587
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Standard PII filters often miss contextual data leakage in RAG systems, such as non-regulated attribute clusters that collectively identify individuals. We introduce a Privacy Policy Enforcement (PPE) framework using dual one-class density estimators with fused text embeddings and a calibrated abstain region for out-of-distribution inputs. Using an axis-stratified, multi-LLM synthetic data pipeline across medicine, finance, and law, we found that traditional Gaussian Mixture baselines fail on borderline-safe stress tests by focusing on linguistic register rather than content. Our proposed T3+OCSVM detector, trained on safe and borderline-safe data, achieves a borderline AUROC of 0.93+ while reducing false positives by 44-55 percentage points and maintaining millisecond latency. Compared to supervised MLP classifiers or 14B-parameter LLM judges, our framework offers superior operational suitability, as the former suffers from high abstention rates and the latter from latency and calibration issues. This methodology provides a robust stress-testing standard for any synthetic-data-trained classifier.
- Abstract(参考訳): 標準的なPIIフィルタは、個人を集合的に識別する非規制属性クラスタなど、RAGシステムにおけるコンテキストデータの漏洩を見逃すことが多い。
本稿では,融合したテキスト埋め込みを用いた2つの一級密度推定器と,アウト・オブ・ディストリビューション入力のためのキャリブレーションされたアプテン領域を用いたプライバシポリシ強化(PPE)フレームワークを提案する。
医学,金融,法をまたいだ軸層化多LLM合成データパイプラインを用いて,従来のガウス混合基線は,コンテンツではなく言語レジスタに着目して,境界線安全なストレステストに失敗することがわかった。
提案するT3+OCSVM検出器は,安全性とバウンダリラインセーフなデータに基づいてトレーニングされ,バウンダリラインAUROCの0.93+を実現し,偽陽性を44~55ポイント削減し,ミリ秒遅れを抑える。
監視型MLP分類器や14BパラメータLPM判定器と比較すると,前者は高い禁断率に悩まされ,後者はレイテンシとキャリブレーションの問題に悩まされるため,より優れた操作適性を提供する。
この手法は、任意の合成データ学習分類器に対して堅牢なストレステスト標準を提供する。
関連論文リスト
- Avoiding Structural Failure Modes in Tabular Fair SSL: Online Primal-Dual Allocation under Confidence Gating [5.890873839907491]
半教師付き学習(SSL)は、限られたラベルで予測できるが、高い精度のアプリケーション(医療、信用、復習)は統計的公正性を保証する必要がある。
オンラインプライマル・デュアル・アロケーション (OPDA) は, 不正, リスク, 疑似ラベルの健康信号を用いて, 公平性とエントロピーに基づく安定性の罰則をスケジュールするオンラインコントローラである。
論文 参考訳(メタデータ) (2026-05-15T01:43:32Z) - Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Is Conformal Factuality for RAG-based LLMs Robust? Novel Metrics and Systematic Insights [7.594584500009769]
大規模言語モデル(LLM)は、知識集約型アプリケーションにおける信頼性を制限し、しばしば幻覚を与える。
検索拡張世代(RAG)と共形事実性は、この制限に対処する潜在的方法として浮上している。
我々は,RAGをベースとしたLCMの信頼性と有用性,評価,校正,堅牢性,効率性を解析した。
論文 参考訳(メタデータ) (2026-03-17T17:20:08Z) - Density-Ratio Weighted Behavioral Cloning: Learning Control Policies from Corrupted Datasets [2.922743999325622]
本稿では,密度比重み付き行動クローンについて紹介する(重み付きBC)。
重み付きBC(Weighted BC)は、2値判別器を介して軌跡レベルの密度比を推定するために、小さな検証済みの基準セットを使用する頑健な模倣学習手法である。
実験により、Weighted BCは汚染率が高い場合でもほぼ最適性能を維持していることが示された。
論文 参考訳(メタデータ) (2025-10-01T21:43:04Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - CAP: Data Contamination Detection via Consistency Amplification [20.135264289668463]
大規模言語モデル(LLM)は広く使われているが、データの汚染に関する懸念は信頼性に疑問を呈している。
本稿では,データセットの漏洩量を測定するためのPCR(Performance Consistency Ratio)を導入した新しいフレームワークである Consistency Amplification-based Data Contamination Detection (CAP)を提案する。
CAPは様々なベンチマークに適用でき、ホワイトボックスモデルとブラックボックスモデルの両方で動作する。
論文 参考訳(メタデータ) (2024-10-19T06:33:33Z) - Exploiting Low-confidence Pseudo-labels for Source-free Object Detection [54.98300313452037]
Source-free Object Detection (SFOD) は、ラベル付きソースデータにアクセスすることなく、未ラベルのターゲットドメインにソーストレーニングされた検出器を適応することを目的としている。
現在のSFOD法は適応相におけるしきい値に基づく擬似ラベル手法を用いる。
疑似ラベルを最大限に活用するために,高信頼度と低信頼度しきい値を導入する手法を提案する。
論文 参考訳(メタデータ) (2023-10-19T12:59:55Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Continuous Doubly Constrained Batch Reinforcement Learning [93.23842221189658]
環境とのオンラインインタラクションではなく、固定されたオフラインデータセットのみを使用して効果的なポリシーを学ぶバッチRLのアルゴリズムを提案する。
バッチRLにおける制限されたデータは、トレーニングデータに不十分に表現された状態/動作の値推定に固有の不確実性をもたらす。
この分散を減らすための政策制約と、過度に楽観的な見積もりを妨げる価値制約という2つの簡単な罰則によってこの問題を軽減することを提案する。
論文 参考訳(メタデータ) (2021-02-18T08:54:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。