Fugu-MT 論文翻訳(概要): The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models

論文の概要: The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models

arxiv url: http://arxiv.org/abs/2408.01228v2
Date: Mon, 19 Aug 2024 13:35:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-21 01:39:16.061155
Title: The Phantom Menace: Unmasking Privacy Leakages in Vision-Language Models
Title（参考訳）: 幻覚の脅威:視覚・言語モデルにおけるプライバシー漏洩を解き明かす
Authors: Simone Caldarella, Massimiliano Mancini, Elisa Ricci, Rahaf Aljundi,
Abstract要約: VLM(Vision-Language Models)は視覚とテキストの理解を統合し、様々なタスクに適している。これらの機能は、Webからクロールされた大量の未処理データのトレーニングに基づいて構築される。本稿では,これらの脆弱性が存在するかどうかを,ID漏洩に着目して評価する。
参考スコア（独自算出の注目度）: 31.166994121531232
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Vision-Language Models (VLMs) combine visual and textual understanding, rendering them well-suited for diverse tasks like generating image captions and answering visual questions across various domains. However, these capabilities are built upon training on large amount of uncurated data crawled from the web. The latter may include sensitive information that VLMs could memorize and leak, raising significant privacy concerns. In this paper, we assess whether these vulnerabilities exist, focusing on identity leakage. Our study leads to three key findings: (i) VLMs leak identity information, even when the vision-language alignment and the fine-tuning use anonymized data; (ii) context has little influence on identity leakage; (iii) simple, widely used anonymization techniques, like blurring, are not sufficient to address the problem. These findings underscore the urgent need for robust privacy protection strategies when deploying VLMs. Ethical awareness and responsible development practices are essential to mitigate these risks.
Abstract（参考訳）: VLM(Vision-Language Models)は、視覚的およびテキスト的理解を組み合わせることで、画像キャプションの生成や、さまざまな領域にわたる視覚的質問への回答など、さまざまなタスクに適している。しかし、これらの機能は、Webからクロールされた大量の未処理データのトレーニングに基づいて構築されている。後者には、VLMが記憶し、リークする可能性のある機密情報が含まれており、重要なプライバシー上の懸念を引き起こす可能性がある。本稿では,これらの脆弱性が存在するかどうかを,ID漏洩に着目して評価する。私たちの研究は3つの重要な発見につながります。 i)VLMは、視覚言語アライメント及び微調整用データの使用時であっても、識別情報を漏洩する。 (二)身元漏洩にはほとんど影響しない。 (三)曖昧化のようにシンプルで広く用いられる匿名化技術は、この問題に対処するには不十分である。これらの知見は、VLMをデプロイする際の堅牢なプライバシ保護戦略の緊急の必要性を浮き彫りにした。倫理的認識と責任ある開発プラクティスは、これらのリスクを軽減するために不可欠です。

関連論文リスト

MultiPriv: Benchmarking Individual-Level Privacy Reasoning in Vision-Language Models [14.942122955210436]
現代のビジョンランゲージモデル(VLM)は、洗練された推論を示し、プライバシーリスクをエスカレートする。現在のプライバシーベンチマークは、この新たな脅威に対して構造的に不十分である。個人レベルのプライバシ推論を体系的に評価するための最初のベンチマークである textbfMultiPriv を提案する。
論文参考訳（メタデータ） (2025-11-21T04:33:11Z)
Privacy Beyond Pixels: Latent Anonymization for Privacy-Preserving Video Understanding [56.369026347458835]
本稿では,ビデオ基盤モデルにおける視覚的プライバシ保護の新たな定式化について紹介する。入力ピクセルレベルの匿名化に関する現在のプライバシー保護手法では、ユーティリティビデオモデル全体を再トレーニングする必要がある。軽量な Anonym Adapter Module (AAM) は、一般的なタスクユーティリティを維持しながら、ビデオ機能からプライベート情報を除去する。
論文参考訳（メタデータ） (2025-11-11T18:56:27Z)
VIP: Visual Information Protection through Adversarial Attacks on Vision-Language Models [15.158545794377169]
我々は,視覚言語モデルにおけるプライバシの保存を敵攻撃問題とみなす。画像中の関心領域内の情報を選択的に隠蔽する新たな攻撃戦略を提案する。 3つの最先端VLMに対する実験結果から、目標ROIの検出において最大98%の低下が見られた。
論文参考訳（メタデータ） (2025-07-11T19:34:01Z)
SoK: Semantic Privacy in Large Language Models [24.99241770349404]
本稿では,大規模言語モデル(LLM)の入力処理,事前学習,微調整,アライメント段階におけるセマンティックプライバシリスクを分析するライフサイクル中心のフレームワークを提案する。我々は、鍵攻撃ベクトルを分類し、差分プライバシー、埋め込み暗号化、エッジコンピューティング、未学習などの現在の防御がこれらの脅威にどのように対処しているかを評価する。セマンティックリークの定量化、マルチモーダル入力の保護、生成品質との非識別性のバランス、プライバシー保護の透明性確保など、オープンな課題の概要をまとめて結論付けます。
論文参考訳（メタデータ） (2025-06-30T08:08:15Z)
AgentStealth: Reinforcing Large Language Model for Anonymizing User-generated Text [8.758843436588297]
AgentStealthは、テキスト匿名化のための自己強化言語モデルである。本手法は, 匿名化の有効性と実用性の両方において, ベースラインよりも優れていることを示す。当社の軽量設計は、エッジデバイスへの直接的なデプロイをサポートし、クラウド依存や通信ベースのプライバシリスクを回避する。
論文参考訳（メタデータ） (2025-06-26T02:48:16Z)
Transferable Adversarial Attacks on Black-Box Vision-Language Models [63.22532779621001]
敵対的攻撃は、テキストのみのコンテキストとビジョンのみのコンテキストにおいて、オープンソースからプロプライエタリなブラックボックスモデルに移行することができる。攻撃者は、特定の攻撃者による視覚情報の解釈を誘導するために、摂動を作れます。普遍的な摂動 -- 広い範囲のイメージに適用可能な修正 -- は、これらの誤解釈を一貫して引き起こすことを発見した。
論文参考訳（メタデータ） (2025-05-02T06:51:11Z)
Unlearning Sensitive Information in Multimodal LLMs: Benchmark and Attack-Defense Evaluation [88.78166077081912]
我々は、MLLMから特定のマルチモーダル知識を削除する方法を評価するために、マルチモーダル・アンラーニング・ベンチマークUnLOK-VQAとアタック・アンド・ディフェンス・フレームワークを導入する。その結果,マルチモーダル攻撃はテキストや画像のみの攻撃よりも優れており,最も効果的な防御は内部モデル状態から解答情報を除去することを示した。
論文参考訳（メタデータ） (2025-05-01T01:54:00Z)
When Data Manipulation Meets Attack Goals: An In-depth Survey of Attacks for VLMs [15.74045364570382]
VLM(Vision-Language Models)に適した攻撃戦略を詳細に調査する。我々はこれらの攻撃をその根底にある目的に基づいて分類する。これらの脆弱性を軽減するために提案されている防衛機構について概説する。
論文参考訳（メタデータ） (2025-02-10T12:20:08Z)
Secure Visual Data Processing via Federated Learning [2.4374097382908477]
本稿では,大規模ビジュアルデータ処理におけるプライバシ保護ソリューションの必要性に対処する。本稿では,オブジェクト検出,フェデレーション学習,匿名化を組み合わせた新しい手法を提案する。私たちのソリューションは、従来の集中型モデルに対して評価されており、精度がわずかにトレードオフされている一方で、プライバシー上のメリットがかなり大きいことを示している。
論文参考訳（メタデータ） (2025-02-09T09:44:18Z)
Benchmarking Vision Language Model Unlearning via Fictitious Facial Identity Dataset [94.13848736705575]
我々は、未学習アルゴリズムの有効性を頑健に評価するために設計された新しいVLMアンラーニングベンチマークであるFacial Identity Unlearning Benchmark (FIUBench)を紹介する。情報ソースとその露出レベルを正確に制御する2段階評価パイプラインを適用した。 FIUBench 内の 4 つのベースライン VLM アンラーニングアルゴリズムの評価により,すべての手法がアンラーニング性能に制限されていることが明らかとなった。
論文参考訳（メタデータ） (2024-11-05T23:26:10Z)
VLMGuard: Defending VLMs against Malicious Prompts via Unlabeled Data [29.806775884883685]
VLMGuardは、未ラベルのユーザプロンプトを悪質なプロンプト検出に利用する、新しい学習フレームワークである。良性検体と悪性検体を区別するための自動悪意度推定スコアを提示する。私たちのフレームワークは、人間のアノテーションを余分に必要とせず、現実世界のアプリケーションに強力な柔軟性と実用性を提供します。
論文参考訳（メタデータ） (2024-10-01T00:37:29Z)
Preserving Privacy in Large Language Models: A Survey on Current Threats and Solutions [12.451936012379319]
大規模言語モデル(LLM)は、人工知能の大幅な進歩を表し、様々な領域にまたがる応用を見つける。トレーニングのための大規模なインターネットソースデータセットへの依存は、注目すべきプライバシー問題を引き起こす。特定のアプリケーション固有のシナリオでは、これらのモデルをプライベートデータで微調整する必要があります。
論文参考訳（メタデータ） (2024-08-10T05:41:19Z)
Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文参考訳（メタデータ） (2024-07-16T14:28:56Z)
Exploring the Privacy Protection Capabilities of Chinese Large Language Models [19.12726985060863]
言語システムにおけるプライバシ評価のための3段階のプログレッシブフレームワークを考案した。我々の主な目的は、大規模言語モデルの個人情報に対する感度を包括的に評価することである。既存の中国の大規模言語モデルは、プライバシー保護の欠点を普遍的に示している。
論文参考訳（メタデータ） (2024-03-27T02:31:54Z)
HFORD: High-Fidelity and Occlusion-Robust De-identification for Face Privacy Protection [60.63915939982923]
顔の身元特定は、身元保護問題を解決するための実践的な方法である。既存の顔の特定方法にはいくつかの問題がある。これらの問題に対処するために,HFORD(High-Fidelity and Occlusion-Robust De-identification)法を提案する。
論文参考訳（メタデータ） (2023-11-15T08:59:02Z)
Can LLMs Keep a Secret? Testing Privacy Implications of Language Models via Contextual Integrity Theory [82.7042006247124]
私たちは、最も有能なAIモデルでさえ、人間がそれぞれ39%と57%の確率で、プライベートな情報を公開していることを示しています。我々の研究は、推論と心の理論に基づいて、新しい推論時プライバシー保護アプローチを即時に探求する必要性を浮き彫りにしている。
論文参考訳（メタデータ） (2023-10-27T04:15:30Z)
Privacy in Large Language Models: Attacks, Defenses and Future Directions [84.73301039987128]
大規模言語モデル(LLM)を対象とした現在のプライバシ攻撃を分析し、敵の想定能力に応じて分類する。本稿では、これらのプライバシー攻撃に対抗するために開発された防衛戦略について概説する。
論文参考訳（メタデータ） (2023-10-16T13:23:54Z)
PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文参考訳（メタデータ） (2023-10-03T22:37:01Z)
Diff-Privacy: Diffusion-based Face Privacy Protection [58.1021066224765]
本稿では,Diff-Privacyと呼ばれる拡散モデルに基づく顔のプライバシー保護手法を提案する。具体的には、提案したマルチスケール画像インバージョンモジュール(MSI)をトレーニングし、元の画像のSDMフォーマット条件付き埋め込みのセットを得る。本研究は,条件付き埋め込みに基づいて,組込みスケジューリング戦略を設計し,デノナイズプロセス中に異なるエネルギー関数を構築し,匿名化と視覚的アイデンティティ情報隠蔽を実現する。
論文参考訳（メタデータ） (2023-09-11T09:26:07Z)
Context-Aware Differential Privacy for Language Modeling [41.54238543400462]
本稿では,CADP-LM(Context-Aware Differentially Private Language Model)を紹介する。 CADP-LMは、潜在的にセンシティブな情報を定義し、監査するために、エンフコンテクスの概念に依存している。 CADP-LMのユニークな特徴は、センシティブな文や文脈のみの保護を目標とする能力である。
論文参考訳（メタデータ） (2023-01-28T20:06:16Z)
Privacy in Deep Learning: A Survey [16.278779275923448]
多くの分野でのディープラーニングの継続的な進歩は、プロダクションシステムにDeep Neural Networks(DNN)の採用につながっている。大規模なデータセットと高い計算能力がこれらの進歩の主な貢献者である。このデータはさまざまな脆弱性によって誤用または漏洩される可能性があるため、プライバシー上の深刻な懸念が生じる。
論文参考訳（メタデータ） (2020-04-25T23:47:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。