論文の概要: MosaicLeaks:Privacy Risks in Querying-in-the-Open for Deep Research Agents
- arxiv url: http://arxiv.org/abs/2605.30727v1
- Date: Fri, 29 May 2026 01:44:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.330141
- Title: MosaicLeaks:Privacy Risks in Querying-in-the-Open for Deep Research Agents
- Title(参考訳): MosaicLeaks:ディープリサーチエージェントに対するクエリー・イン・ザ・オープンのリスク
- Authors: Alexander Gurung, Spandana Gella, Alexandre Drouin, Issam H. Laradji, Perouz Taslakian, Rafael Pardinas,
- Abstract要約: ディープリサーチエージェントは、プライベートなローカルドキュメントをWeb検索のような外部ツールと組み合わせて、プライバシーリスクを生じさせている。
プライベートなエンタープライズドキュメントとパブリックなWebコーパスをチェーンする1,001のディープリサーチタスクのベンチマークであるMosaicLeaksを紹介します。
私たちは、家族やサイズにわたるモデルが3つのレベルすべてに頻繁にリークしていることに気付きました。
- 参考スコア(独自算出の注目度): 76.60965179634664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep research agents increasingly combine private local documents with external tools like web retrieval, creating a privacy risk: an agent's external queries may leak sensitive information from its local context. This risk is amplified by the mosaic effect, where individual queries may appear harmless but become revealing in aggregate. We introduce MosaicLeaks, a benchmark of 1,001 multi-hop deep research tasks that chain private enterprise documents and a public web corpus, forcing agents to make external queries that depend on local information. We evaluate leakage with an adversary LLM that observes only the agent's external queries and attempts to infer private information at three levels: the agent's research intent, answers to specific private questions and verifiable claims about the enterprise documents. We find that models across families and sizes frequently leak at all three levels, that zero-shot privacy prompting reduces but does not eliminate leakage and that reinforcement learning for task performance alone worsens leakage. To address this, we propose Privacy-Aware Deep Research (PA-DR), an RL framework that combines situational rewards for task success with a learned privacy classifier to provide dense credit assignment over both per-query and mosaic-level leakage. Training Qwen3-4B-Instruct with PA-DR improves accuracy from 48.7% to 58.7% and reduces answer and full-information leakage from 34.0% to 9.9%.
- Abstract(参考訳): ディープリサーチエージェントは、プライベートなローカルドキュメントとWeb検索のような外部ツールを組み合わせることで、プライバシリスクを生み出している。
このリスクはモザイク効果によって増幅され、個々のクエリは無害に見えるが、集合的に明らかになる。
我々は、プライベートエンタープライズ文書とパブリックウェブコーパスをチェーンする1,001のマルチホップディープリサーチタスクのベンチマークであるMosaicLeaksを紹介し、エージェントにローカル情報に依存する外部クエリを強制する。
我々は,エージェントの外部クエリのみを観察し,エージェントの研究意図,特定のプライベートな質問に対する回答,企業文書に対する検証可能なクレームの3つのレベルにおいて,プライベートな情報を推論しようとする敵対的LCMによる漏洩を評価する。
ゼロショットのプライバシーは低下するが、リークを排除せず、タスクパフォーマンスのみの強化学習がリークを悪化させる。
そこで我々は,タスク成功に対する状況報酬と学習されたプライバシ分類器を組み合わせたRLフレームワークであるPrivacy-Aware Deep Research (PA-DR)を提案する。
Qwen3-4B-Instruct with PA-DRは精度を48.7%から58.7%に改善し、回答と全情報漏洩を34.0%から9.9%に削減する。
関連論文リスト
- Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents [52.02752011119451]
我々は人間の意識のレンズを通して現実世界におけるプライバシーの認識を調査する。
我々は、現実世界の人間のプライバシーリスクを3段階に分類するPrivacyIcebergを提案する。
論文 参考訳(メタデータ) (2026-05-07T13:21:44Z) - 1-2-3 Check: Enhancing Contextual Privacy in LLM via Multi-Agent Reasoning [18.751008976082655]
プライバシ推論を専門のサブタスク(抽出,分類)に分解するマルチエージェントフレームワークを導入する。
情報フロートポロジに対して系統的なアブレーションを行い、上流検出がダウンストリームリークにカスケードを間違えた理由を明らかにした。
論文 参考訳(メタデータ) (2025-08-11T06:34:09Z) - MAGPIE: A dataset for Multi-AGent contextual PrIvacy Evaluation [54.410825977390274]
LLMエージェントのコンテキストプライバシを評価するための既存のベンチマークは、主にシングルターン、低複雑さタスクを評価する。
まず、15ドメインにわたる158のリアルタイムハイテイクシナリオからなるベンチマーク-MAGPIEを示す。
次に、コンテキスト的にプライベートなデータに対する理解と、ユーザのプライバシを侵害することなくコラボレーションする能力に基づいて、最先端のLCMを評価します。
論文 参考訳(メタデータ) (2025-06-25T18:04:25Z) - Privacy Leakage Overshadowed by Views of AI: A Study on Human Oversight of Privacy in Language Model Agent [3.89966779727297]
個人のタスクを代行する言語モデル(LM)エージェントは生産性を向上するが、意図しないプライバシー漏洩のリスクも受けやすい。
本研究は、LMエージェントのプライバシ含意を監督する人々の能力に関する最初の研究である。
論文 参考訳(メタデータ) (2024-11-02T19:15:42Z) - PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。