Fugu-MT 論文翻訳(概要): CAMP: Cumulative Agentic Masking and Pruning for Privacy Protection in Multi-Turn LLM Conversations

論文の概要: CAMP: Cumulative Agentic Masking and Pruning for Privacy Protection in Multi-Turn LLM Conversations

arxiv url: http://arxiv.org/abs/2604.16521v1
Date: Thu, 16 Apr 2026 03:44:39 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-22 14:04:47.716898
Title: CAMP: Cumulative Agentic Masking and Pruning for Privacy Protection in Multi-Turn LLM Conversations
Title（参考訳）: CAMP:マルチターンLDM会話における累積エージェントマスキングとプライバシ保護のためのプルーニング
Authors: Aman Panjwani,
Abstract要約: マルチターン会話のためのクロスターンプライバシ保護フレームワークを提案する。 CAMP(Cumulative Agentic Masking and Pruning)は、完全な会話ユーティリティを保持しながら、再識別可能なプロファイルを中和する。 CAMPは、医療、雇用、財務、一般的な会話にまたがる4つの総合的なマルチターンシナリオで評価される。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The deployment of Large Language Models in agentic, multi-turn conversational settings has introduced a class of privacy vulnerabilities that existing protection mechanisms are not designed to address. Current approaches to Personally Identifiable Information (PII) masking operate on a per-turn basis, scanning each user message in isolation and replacing detected entities with typed placeholders before forwarding sanitized text to the model. While effective against direct identifier leakage within a single message, these methods are fundamentally stateless and fail to account for the compounding privacy risk that emerges when PII fragments accumulate across conversation turns. A user who separately discloses their name, employer, location, and medical condition across several messages has revealed a fully re-identifiable profile - yet no individual message would trigger a per-turn masker. We formalize this phenomenon as Cumulative PII Exposure (CPE) and propose CAMP (Cumulative Agentic Masking and Pruning), a cross-turn privacy protection framework for multi-turn LLM conversations. CAMP maintains a session-level PII registry, constructs a co-occurrence graph to model combination risk between entity types, computes a CPE score after each turn, and triggers retroactive masking of conversation history when the score crosses a configurable threshold. We evaluate CAMP on four synthetic multi-turn scenarios spanning healthcare, hiring, finance, and general conversation, demonstrating that per-turn baselines expose re-identifiable profiles that CAMP successfully neutralizes while preserving full conversational utility.
Abstract（参考訳）: エージェント的でマルチターンの会話設定における大規模言語モデルのデプロイは、既存の保護メカニズムが対処するように設計されていない、一連のプライバシ脆弱性を導入している。個人識別情報(PII)マスキングへの現在のアプローチはターンごとに動作し、各ユーザーメッセージを個別にスキャンし、検出されたエンティティをモデルに衛生テキストを転送する前にタイプドプレースホルダーに置き換える。単一のメッセージ内で直接識別子の漏洩に対して効果があるが、これらの方法は基本的にステートレスであり、会話中にPIIフラグメントが蓄積されたときに生じる複雑なプライバシーリスクを考慮できない。複数のメッセージで名前、雇用主、場所、および医療条件を別々に開示したユーザーが、完全に再確認可能なプロフィールを明らかにした。我々は、この現象をCPE(Cumulative PII Exposure)として定式化し、マルチターンLDM会話のためのクロスターンプライバシ保護フレームワークであるCAMP(Cumulative Agentic Masking and Pruning)を提案する。 CAMPはセッションレベルのPIIレジストリを保持し、エンティティタイプ間の結合リスクをモデル化するための共起グラフを構築し、各ターン後にCPEスコアを計算し、スコアが設定可能なしきい値を超えたときに会話履歴の遡及的なマスキングをトリガーする。 CAMPは、医療、雇用、財務、一般的な会話にまたがる4つの総合的なマルチターンシナリオで評価し、ターン単位のベースラインが、CAMPが完全な会話ユーティリティを維持しながら、正常に中和する再識別可能なプロファイルを公開することを示した。

関連論文リスト

NeuroFilter: Privacy Guardrails for Conversational LLM Agents [50.75206727081996]
本研究は,エージェント型大規模言語モデル(LLM)のプライバシを強制する際の計算上の課題に対処する。 NeuroFilterは、標準違反をモデルのアクティベーション空間における単純な方向にマッピングすることで、コンテキスト整合性を運用するガードレールフレームワークである。 7Bから70Bパラメータのモデルをカバーする15万以上のインタラクションに対する包括的な評価は、NeuroFilterの強力なパフォーマンスを示している。
論文参考訳（メタデータ） (2026-01-21T05:16:50Z)
When Privacy Meets Recovery: The Overlooked Half of Surrogate-Driven Privacy Preservation for MLLM Editing [61.80513991207956]
この研究は、さまざまなMLLMシナリオでサロゲート駆動の保護されたデータを復元する方法の課題に焦点を当てている。私たちはまず、SPPE(Surrogate Privacy Protected Editable)データセットの提供によって、この研究ギャップを埋めます。 MLLM生成編集の忠実さを保ちながら、プライベートコンテンツを確実に再構築する統一的な手法を提案する。
論文参考訳（メタデータ） (2025-12-08T04:59:03Z)
Semantically-Aware LLM Agent to Enhance Privacy in Conversational AI Services [0.0]
遠隔Large Language Models (LLM) を用いた場合, センシティブなPIIデータを保護するためのセマンティック・アウェア・プライバシ・エージェントを提案する。応答品質を劣化させるような以前の作業とは異なり、我々のアプローチはユーザプロンプトのセンシティブなPIIエンティティを意味的に一貫した名前で動的に置き換える。この結果から,LOPSIDEDは基本手法と比較して意味的ユーティリティエラーを5倍に削減できることがわかった。
論文参考訳（メタデータ） (2025-10-30T21:34:23Z)
SoK: Semantic Privacy in Large Language Models [24.99241770349404]
本稿では,大規模言語モデル(LLM)の入力処理,事前学習,微調整,アライメント段階におけるセマンティックプライバシリスクを分析するライフサイクル中心のフレームワークを提案する。我々は、鍵攻撃ベクトルを分類し、差分プライバシー、埋め込み暗号化、エッジコンピューティング、未学習などの現在の防御がこれらの脅威にどのように対処しているかを評価する。セマンティックリークの定量化、マルチモーダル入力の保護、生成品質との非識別性のバランス、プライバシー保護の透明性確保など、オープンな課題の概要をまとめて結論付けます。
論文参考訳（メタデータ） (2025-06-30T08:08:15Z)
Automated Profile Inference with Language Model Agents [67.32226960040514]
自動プロファイル推論(Automatic Profile Inference)と呼ばれる,LLMがオンラインの偽名にもたらす新たな脅威について検討する。相手は、LDMに対して、疑似プラットフォーム上で公開されているユーザアクティビティから、機密性の高い個人属性を自動的に取り除き、抽出するように指示することができる。実世界のシナリオにおけるこのような脅威の可能性を評価するために,AutoProfilerという自動プロファイリングフレームワークを導入する。
論文参考訳（メタデータ） (2025-05-18T13:05:17Z)
Anti-adversarial Learning: Desensitizing Prompts for Large Language Models [13.674984661911607]
本稿では,LLMプロンプトを脱感作する方法であるPromptObfusを提案する。 PromptObfusの基本的な考え方は"反逆的"な学習であり、プライバシーの言葉を不明瞭な機密情報へと誘惑する。 PromptObfus はタスク性能を保ちながらリモート LLM からのプライバシ推論を効果的に防止できることを示す。
論文参考訳（メタデータ） (2025-04-25T06:19:02Z)
Prompt-Guided Mask Proposal for Two-Stage Open-Vocabulary Segmentation [21.30568336073013]
オープン語彙セグメンテーション(open-vocabulary segmentation)の課題に取り組み、異なる環境における幅広いカテゴリのオブジェクトを識別する必要がある。既存の方法はCLIPのようなマルチモーダルモデルを使うことが多い。本稿では,PMP(Prompt-Guided Mask Proposal)を提案する。
論文参考訳（メタデータ） (2024-12-13T17:22:50Z)
DPMAC: Differentially Private Communication for Cooperative Multi-Agent Reinforcement Learning [21.961558461211165]
コミュニケーションは、人間社会とマルチエージェント強化学習(MARL)における協力の基礎となる。本稿では,各エージェントに厳密な$(epsilon, delta)$-differential privacy guaranteeを付与したローカルメッセージ送信装置を装備することにより,個々のエージェントのセンシティブな情報を保護できる,テキスト・ディペンデンシャル・プライベート・マルチエージェント・コミュニケーション(DPMAC)アルゴリズムを提案する。我々は、プライバシ保護通信と協調的なMARLにおけるナッシュ均衡の存在を証明し、この問題がゲーム理論的に学習可能であることを示唆する。
論文参考訳（メタデータ） (2023-08-19T04:26:23Z)
CleanCLIP: Mitigating Data Poisoning Attacks in Multimodal Contrastive Learning [63.72975421109622]
CleanCLIPは、バックドア攻撃によって引き起こされる学習された刺激的関連を弱める微調整フレームワークである。 CleanCLIPは、マルチモーダル・コントラッシブ・ラーニングに対するバックドア・アタックを根絶しながら、良質な例によるモデル性能を維持している。
論文参考訳（メタデータ） (2023-03-06T17:48:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。