論文の概要: Seeing Without Exposing: Adaptive Privacy Control for Open-World, Context-Hungry MLLMs
- arxiv url: http://arxiv.org/abs/2606.07175v1
- Date: Fri, 05 Jun 2026 11:41:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.716045
- Title: Seeing Without Exposing: Adaptive Privacy Control for Open-World, Context-Hungry MLLMs
- Title(参考訳): 公開なしで見る:オープンワールド、コンテキストハングリーMLLMのための適応的プライバシ制御
- Authors: Siyuan Xu, Yibing Liu, Peilin Chen, Yung-Hui Li, Shiqi Wang, Sam Kwong,
- Abstract要約: MLLMにおけるプライバシー問題に対処するために,Anchored Privacy Drifting (APD)を提案する。
APDは、コンテキストキューをソースイメージに固定しながら、意味論的に等価な代替手段に向けて、プライバシに敏感な要素をドリフトする。
本手法は,プライバシ・サニタイゼーションとコンテンツ保持の両面でバランスのとれた改善を実現する。
- 参考スコア(独自算出の注目度): 61.80513991207956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal large language models (MLLMs) have raised new privacy challenges. On the data side, user-provided inputs often include unpredictable sensitive information; while on the downstream task side, model reasoning depends on rich visual context that may itself be privacy-sensitive. Existing privacy protection methods, however, rely on predefined sensitive categories and fixed obfuscation strategies, struggling to tackle such challenges in MLLMs. To address this dilemma, we propose Anchored Privacy Drifting (APD), a training-free method that drifts privacy-sensitive elements toward semantically equivalent alternatives while anchoring contextual cues to the source image. To systematically evaluate this dual objective of privacy protection and contextual preservation, we introduce AdaptShield, a comprehensive benchmark covering 22 privacy categories, which combines conventional privacy metrics with MLLM-based assessments of contextual utility. Extensive experiments show that our method achieves balanced improvements in both privacy sanitization and content retention, with average gains of 10.4% on textual categories and 8.5% under MLLM-based evaluation across four MLLM series, i.e., Qwen2.5, Qwen3, InternVL3, and InternVL3.5.
- Abstract(参考訳): マルチモーダル大言語モデル(MLLM)は、新たなプライバシー問題を引き起こしている。
データ側では、ユーザが提供する入力には予測不可能な機密情報が含まれることが多く、下流のタスク側では、モデル推論は、それ自体がプライバシーに敏感なリッチな視覚的コンテキストに依存する。
しかし、既存のプライバシー保護手法は、MLLMにおけるこのような課題に取り組むのに苦労し、定義済みの機密カテゴリーと固定された難読化戦略に依存している。
このジレンマに対処するために、Anchored Privacy Drifting (APD) というトレーニング不要な手法を提案する。
プライバシ保護とコンテキスト保存という2つの目的を体系的に評価するために,従来のプライバシ指標とMLLMに基づくコンテキストユーティリティ評価を組み合わせた,22のプライバシカテゴリをカバーする包括的なベンチマークであるAdaptShieldを紹介した。
本手法は,4シリーズ,Qwen2.5,Qwen3,InternVL3,InternVL3.5において,テキストカテゴリで平均10.4%,MLLMで平均8.5%向上した。
関連論文リスト
- When Visual Privacy Protection Meets Multimodal Large Language Models [28.059357669311666]
本稿では,視覚的プライバシとMLLMの性能のトレードオフを改善するための新しいフレームワークを提案する。
我々の手法は異なるベンチマークで有効である。
論文 参考訳(メタデータ) (2026-03-14T15:15:32Z) - VoxPrivacy: A Benchmark for Evaluating Interactional Privacy of Speech Language Models [25.266028200777317]
音声言語モデル(SLM)は、ユーザが適切に情報の流れを管理するために区別されることが期待される。
現在のSLMベンチマークでは、対話能力をテストするが、話者識別は見落としている。
我々は、SLMにおけるインタラクションプライバシを評価するために設計された最初のベンチマークであるVoxPrivacyを紹介する。
論文 参考訳(メタデータ) (2026-01-27T06:22:14Z) - Who Can See Through You? Adversarial Shielding Against VLM-Based Attribute Inference Attacks [13.326888254423901]
VLMベースの属性推論攻撃は、ソーシャルメディア上で共有された画像から、敵対者が個人属性を推測できるようにする、深刻なプライバシー上の懸念として浮上している。
本稿では,視覚的制約下でのプライバシー抑制とユーティリティ保護を協調的に最適化する新しい保護手法を提案する。
提案手法は, PARを25%以下に効果的に削減し, NPARを88%以上に抑えるとともに, 未確認・言い換えのプライバシー問題に対してよく一般化する。
論文 参考訳(メタデータ) (2025-12-20T08:08:50Z) - When Privacy Meets Recovery: The Overlooked Half of Surrogate-Driven Privacy Preservation for MLLM Editing [61.80513991207956]
この研究は、さまざまなMLLMシナリオでサロゲート駆動の保護されたデータを復元する方法の課題に焦点を当てている。
私たちはまず、SPPE(Surrogate Privacy Protected Editable)データセットの提供によって、この研究ギャップを埋めます。
MLLM生成編集の忠実さを保ちながら、プライベートコンテンツを確実に再構築する統一的な手法を提案する。
論文 参考訳(メタデータ) (2025-12-08T04:59:03Z) - PRISM: Privacy-Aware Routing for Adaptive Cloud-Edge LLM Inference via Semantic Sketch Collaboration [8.776463501718737]
プライバシと推論品質を動的にバランスさせるコンテキスト認識フレームワークを提案する。
PRISMは,(1)エッジデバイスがエンティティレベルの感度をプロファイルし,(2)エッジ上のソフトゲーティングモジュールが実行モード - クラウド,エッジ,あるいはコラボレーションを選択し,(3)協調経路に対して,(3)エッジがエンティティリスクに基づいて適応的な2層局所微分プライバシーを適用し,(4)クラウドLLMが乱れたプロンプトからセマンティックスケッチを生成する。
論文 参考訳(メタデータ) (2025-11-27T22:32:33Z) - Multi-P$^2$A: A Multi-perspective Benchmark on Privacy Assessment for Large Vision-Language Models [65.2761254581209]
LVLM(Large Vision-Language Models)21個のオープンソースと2個のクローズドソースのプライバシ保護機能の評価を行った。
Multi-P$2$Aに基づいて、21のオープンソースと2つのクローズドソースLVLMのプライバシ保護機能を評価する。
以上の結果から,現在のLVLMは一般にプライバシー侵害のリスクが高いことが明らかとなった。
論文 参考訳(メタデータ) (2024-12-27T07:33:39Z) - PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。