論文の概要: MuPPET: A Benchmark for Contextual Privacy of LLM Assistants in Multi-Party Conversations
- arxiv url: http://arxiv.org/abs/2606.23217v1
- Date: Mon, 22 Jun 2026 12:06:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 23:13:18.900014
- Title: MuPPET: A Benchmark for Contextual Privacy of LLM Assistants in Multi-Party Conversations
- Title(参考訳): MuPPET:多人数会話におけるLLMアシスタントのコンテキストプライバシのベンチマーク
- Authors: Elena Sofia Ruzzetti, Cornelius Emde, Sangdoo Yun, Seong Joon Oh, Martin Gubri,
- Abstract要約: マルチパーティ会話におけるコンテキストプライバシのベンチマークである MuPPET (Multi-Party Privacy Exposure Testing) を導入する。
実験により、モデルが1対1の評価よりも、マルチパーティ設定でかなりリークしていることが示されている。
- 参考スコア(独自算出の注目度): 48.01548482992868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents are increasingly deployed in multi-party environments, handling sensitive personal data on behalf of individual users, for instance in group chats. When such an agent discloses private information, it reaches every group member at once. This risk is structurally harder to control than in one-to-one settings, as every piece of private information must be appropriate for every recipient in the group. Yet all existing contextual privacy benchmarks consider only single-interlocutor settings, leaving multi-party privacy risks unmeasured. We introduce MuPPET (Multi-Party Privacy Exposure Testing), a benchmark for contextual privacy in multi-party conversations. Our experiments show that models leak substantially more in multi-party settings than one-to-one evaluations suggest. Frontier models are vulnerable, and smaller open-weights models, often preferred for local deployment with sensitive data, even more so. Existing contextual privacy defences offer only partial protection, degrade utility, and do not resolve the underlying party-tracking problem.
- Abstract(参考訳): LLMエージェントは、例えばグループチャットにおいて、個々のユーザーに代わって機密性の高い個人情報を扱うマルチパーティ環境にますますデプロイされている。
そのようなエージェントがプライベート情報を開示すると、すぐにすべてのグループメンバーに届く。
このリスクは、グループ内のすべての受信者に対して、すべてのプライベート情報が適切でなければならないため、1対1の設定よりも構造的に制御が難しい。
しかし、既存のすべてのコンテキストプライバシベンチマークは、単一インターロケータ設定のみを考慮しており、マルチパーティのプライバシリスクは未測定のままである。
マルチパーティ会話におけるコンテキストプライバシのベンチマークである MuPPET (Multi-Party Privacy Exposure Testing) を導入する。
実験により,マルチパーティ設定において,モデルが1対1評価よりもかなり流出していることが示唆された。
フロンティアモデルは脆弱で、より小さなオープンウェイトモデルで、敏感なデータを備えたローカルデプロイメントに好まれることが多い。
既存のコンテキストプライバシ保護は、部分的保護のみを提供し、ユーティリティを劣化させ、基礎となるパーティ追跡問題を解決しない。
関連論文リスト
- 1-2-3 Check: Enhancing Contextual Privacy in LLM via Multi-Agent Reasoning [18.751008976082655]
プライバシ推論を専門のサブタスク(抽出,分類)に分解するマルチエージェントフレームワークを導入する。
情報フロートポロジに対して系統的なアブレーションを行い、上流検出がダウンストリームリークにカスケードを間違えた理由を明らかにした。
論文 参考訳(メタデータ) (2025-08-11T06:34:09Z) - MAGPIE: A dataset for Multi-AGent contextual PrIvacy Evaluation [54.410825977390274]
LLMエージェントのコンテキストプライバシを評価するための既存のベンチマークは、主にシングルターン、低複雑さタスクを評価する。
まず、15ドメインにわたる158のリアルタイムハイテイクシナリオからなるベンチマーク-MAGPIEを示す。
次に、コンテキスト的にプライベートなデータに対する理解と、ユーザのプライバシを侵害することなくコラボレーションする能力に基づいて、最先端のLCMを評価します。
論文 参考訳(メタデータ) (2025-06-25T18:04:25Z) - PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z) - Segmented Private Data Aggregation in the Multi-message Shuffle Model [9.298982907061099]
我々は、差分プライバシーのマルチメッセージシャッフルモデルにおいて、セグメント化されたプライベートデータアグリゲーションの研究を開拓した。
当社のフレームワークでは,ユーザに対するフレキシブルなプライバシ保護と,アグリゲーションサーバのための拡張ユーティリティを導入している。
提案手法は,既存手法と比較して推定誤差を約50%削減する。
論文 参考訳(メタデータ) (2024-07-29T01:46:44Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - PrivLM-Bench: A Multi-level Privacy Evaluation Benchmark for Language Models [42.20437015301152]
言語モデル(LM)のプライバシー漏洩を評価するベンチマークであるPrivLM-Benchを提案する。
DPパラメータのみを報告するのではなく、PrivLM-Benchは実際の使用中に無視された推論データのプライバシに光を当てる。
メインストリームLMのためのGLUEの3つのデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-11-07T14:55:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。