論文の概要: Need to Know: Contextual-Integrity-Grounded Query Rewriting for Privacy-Conscious LLM Delegation
- arxiv url: http://arxiv.org/abs/2606.04067v1
- Date: Tue, 02 Jun 2026 14:28:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.286169
- Title: Need to Know: Contextual-Integrity-Grounded Query Rewriting for Privacy-Conscious LLM Delegation
- Title(参考訳): 知っておく必要がある: プライバシーに配慮したLLMデリゲーションのためのコンテキスト不変なクエリ書き換え
- Authors: Xinyue Huang, Xiaochun Cao, Wenyuan Yang,
- Abstract要約: コンテキスト整合性(Contextual Integrity)の下でクエリの書き直しを保存したプライバシをリキャストします。
本稿では,CI誘導型強化学習フレームワークを提案する。
実験により、学習したリライターは、デバイス上のベースラインに対して+10.1平均ユーティリティを達成し、最高のプライバシユーティリティトレードオフを達成することが示された。
- 参考スコア(独自算出の注目度): 50.614874098786515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As LLMs become increasingly woven into everyday workflows, user queries sent to cloud hosted LLMs routinely mix task-essential content with task non-essential sensitive disclosures, yet type based PII redaction is context agnostic and may raise two issues: over disclosing untyped sensitive context and over removing answer bearing spans. We recast privacy preserving query rewriting under Contextual Integrity: a span should be forwarded only if it is necessary for the task. We introduce DelegateCI-Bench, the first task based Contextual Integrity benchmark for privacy-conscious delegation, comprising 3,167 samples that combine high quality synthetic data spanning 11 tasks and 20 task types, WildChat based real user queries, and a medical challenge set with dense sensitive information. Building on this benchmark, we propose a CI-guided reinforcement learning framework that converts essential and non-essential sensitive spans into verifiable optimization signals, and train a query rewriter to preserve task critical information while suppressing unnecessary sensitive disclosure. Experiments show that our learned rewriter achieves the best privacy-utility tradeoff, achieving up to +10.1 average utility over on-device baselines.
- Abstract(参考訳): LLMが日常のワークフローに織り込まれていくにつれて、クラウドにホストされたLLMに送信されるユーザクエリは、タスク内容のコンテンツとタスク内容の機密性の高い開示を日常的に混ぜる。
コンテキスト整合性(Contextual Integrity)の下で、クエリの書き直しをプライバシにリキャストします。
DelegateCI-Benchは、11のタスクと20のタスクタイプにまたがる高品質な合成データを組み合わせた3,167のサンプルと、WildChatベースの実際のユーザクエリと、密集した機密情報を備えた医療的課題からなる、プライバシ意識デリゲーションのための最初のタスクベースコンテキスト統合ベンチマークである。
本稿では,CI誘導型強化学習フレームワークを提案する。このフレームワークは,重要かつ重要でないセンシティブスパンを検証可能な最適化信号に変換し,不必要なセンシティブな開示を抑えつつ,タスククリティカル情報を保存するためにクエリリライタを訓練する。
実験により、学習したリライターは、デバイス上のベースラインに対して+10.1平均ユーティリティを達成し、最高のプライバシユーティリティトレードオフを達成することが示された。
関連論文リスト
- It Takes Two: Complementary Self-Distillation for Contextual Integrity in LLMs [73.46918128880786]
タスク解決から情報抑制を分離する自己蒸留フレームワーク。
タスク解決から情報抑制を分離する自己蒸留フレームワーク。
論文 参考訳(メタデータ) (2026-05-18T13:57:44Z) - Anonymous-by-Construction: An LLM-Driven Framework for Privacy-Preserving Text [0.42821598129654453]
テキストを匿名化するLLM駆動置換パイプラインをオンプレミスで開発する。
プライバシー、セマンティックユーティリティ、およびプライバシー下でのトレーサビリティを測定します。
提案手法は,最先端のプライバシ,トピックドリフトの最小化,実効性の向上,トレーニング可能性の低下を実現する。
論文 参考訳(メタデータ) (2026-03-17T23:46:15Z) - From Completion to Editing: Unlocking Context-Aware Code Infilling via Search-and-Replace Instruction Tuning [81.97788535387286]
本稿では,エージェントによる検証・編集機構を統一された単一パス推論プロセスに内部化するフレームワークを提案する。
最小限のデータで、SRI-Coderは、ChatモデルがBaseモデルの完了性能を上回ることができる。
FIMスタイルのチューニングとは異なり、SRIは一般的なコーディング能力を保持し、標準のFIMに匹敵する推論遅延を維持する。
論文 参考訳(メタデータ) (2026-01-19T20:33:53Z) - PrivacyPAD: A Reinforcement Learning Framework for Dynamic Privacy-Aware Delegation [33.37227619820212]
この問題を解決するために、プライバシPADと呼ばれる新しい強化学習フレームワークを導入する。
我々のフレームワークは、エージェントにテキストチャンクを動的にルーティングするように訓練し、プライバシリークとタスクパフォーマンスのトレードオフを最適にバランスさせるポリシーを学ぶ。
当社のフレームワークは,プライバシ・ユーティリティ・フロンティアにおける新たな最先端を実現する。
論文 参考訳(メタデータ) (2025-10-16T19:38:36Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - Teaching Language Models To Gather Information Proactively [53.85419549904644]
大規模言語モデル(LLM)は、ますます協力的なパートナーとして機能することが期待されている。
本研究では,アクティブな情報収集という新たなタスクパラダイムを導入する。
キー情報をマスキングする、部分的に特定された現実世界のタスクを生成するスケーラブルなフレームワークを設計する。
このセットアップの中核となるイノベーションは、真に新しい暗黙のユーザー情報を引き出す質問に報酬を与える、強化された微調整戦略です。
論文 参考訳(メタデータ) (2025-07-28T23:50:09Z) - ACCESS DENIED INC: The First Benchmark Environment for Sensitivity Awareness [2.5967788365637103]
大規模言語モデル(LLM)は、様々な文書フォーマットからテキストを処理する能力のため、企業データ管理にとってますます価値が増している。
この研究は、敏感な言語モデルの基礎を確立し、企業環境におけるプライバシ中心のAIシステムを強化するための洞察を提供する。
論文 参考訳(メタデータ) (2025-06-01T11:24:23Z) - Contextual Integrity in LLMs via Reasoning and Reinforcement Learning [41.795843170879046]
我々は、文脈整合性を達成するために必要な理由をモデルに具現化する強化学習フレームワークを開発する。
本研究では,タスク性能を維持しながら,不適切な情報開示を大幅に低減することを示す。
論文 参考訳(メタデータ) (2025-05-29T21:26:21Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。