論文の概要: GeoShield: Safeguarding Geolocation Privacy from Vision-Language Models via Adversarial Perturbations
- arxiv url: http://arxiv.org/abs/2508.03209v1
- Date: Tue, 05 Aug 2025 08:37:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.865275
- Title: GeoShield: Safeguarding Geolocation Privacy from Vision-Language Models via Adversarial Perturbations
- Title(参考訳): GeoShield: 対向的摂動による視覚言語モデルからの位置情報プライバシ保護
- Authors: Xinwei Liu, Xiaojun Jia, Yuan Xun, Simeng Qin, Xiaochun Cao,
- Abstract要約: VLM(Vision-Language Models)は、パブリック共有画像からユーザの位置を推測し、ジオプライバシーに重大なリスクをもたらす。
実世界のシナリオにおいて,ロバストなジオプライバシー保護のために設計された,新しい敵対的フレームワークであるGeoShieldを提案する。
- 参考スコア(独自算出の注目度): 48.78781663571235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-Language Models (VLMs) such as GPT-4o now demonstrate a remarkable ability to infer users' locations from public shared images, posing a substantial risk to geoprivacy. Although adversarial perturbations offer a potential defense, current methods are ill-suited for this scenario: they often perform poorly on high-resolution images and low perturbation budgets, and may introduce irrelevant semantic content. To address these limitations, we propose GeoShield, a novel adversarial framework designed for robust geoprivacy protection in real-world scenarios. GeoShield comprises three key modules: a feature disentanglement module that separates geographical and non-geographical information, an exposure element identification module that pinpoints geo-revealing regions within an image, and a scale-adaptive enhancement module that jointly optimizes perturbations at both global and local levels to ensure effectiveness across resolutions. Extensive experiments on challenging benchmarks show that GeoShield consistently surpasses prior methods in black-box settings, achieving strong privacy protection with minimal impact on visual or semantic quality. To our knowledge, this work is the first to explore adversarial perturbations for defending against geolocation inference by advanced VLMs, providing a practical and effective solution to escalating privacy concerns.
- Abstract(参考訳): GPT-4oのような視覚言語モデル(VLM)は、パブリックな共有画像からユーザの位置を推測する驚くべき能力を示し、ジオプライバシーに重大なリスクをもたらす。
敵の摂動は潜在的な防御を提供するが、現在の手法はこのシナリオに不適であり、高解像度の画像と低摂動予算でよく機能し、無関係なセマンティックコンテンツを導入することがある。
これらの制約に対処するために,実世界のシナリオにおいて,ロバストなジオプライバシー保護のために設計された,新しい敵対的フレームワークであるGeoShieldを提案する。
GeoShieldは3つの重要なモジュールで構成されている: 地理的および非地理的情報を分離する機能障害モジュール、画像内のジオリーベリング領域をピンポイントする露光要素識別モジュール、グローバルレベルとローカルレベルの摂動を共同で最適化し、解像度を越えた有効性を保証するスケール適応拡張モジュール。
挑戦的なベンチマークに関する大規模な実験によると、GeoShieldはブラックボックス設定の従来のメソッドを一貫して上回り、視覚的あるいはセマンティックな品質に最小限の影響で強力なプライバシ保護を実現している。
我々の知る限り、この研究は、先進的なVLMによる位置推定を防御するための敵の摂動を初めて探求し、プライバシーの懸念をエスカレートするための実用的で効果的な解決策を提供する。
関連論文リスト
- Evaluation of Geolocation Capabilities of Multimodal Large Language Models and Analysis of Associated Privacy Risks [9.003350058345442]
MLLMは、視覚コンテンツのみに基づいて画像の位置を推測することができる。
これは、doxx、監視、その他のセキュリティ脅威を含む、プライバシー侵害の深刻なリスクを引き起こす。
最も先進的な視覚モデルは、1kmの範囲内で最大49%の精度でストリートレベルの画像の起源をローカライズすることができる。
論文 参考訳(メタデータ) (2025-06-30T03:05:30Z) - Network Hexagons Under Attack: Secure Crowdsourcing of Geo-Referenced Data [0.0]
本稿では,公開鍵基盤(PKI)と短命証明書を組み合わせたセキュリティアーキテクチャを提案する。
提案手法は,ランダム化鍵回転と適応的地理空間分解能により,ユーザとデバイスの匿名性を保証する。
以上の結果から,レイテンシが25%以上向上したり,スループットが7%以上低下したりすることなく,必要なセキュリティレベルを達成することが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-06-05T21:27:10Z) - Doxing via the Lens: Revealing Location-related Privacy Leakage on Multi-modal Large Reasoning Models [37.18986847375693]
広告主は、ユーザ生成画像からセンシティブな位置情報を推測することができる。
DoxBenchは、さまざまなプライバシーシナリオを反映した500の現実世界の画像のキュレートされたデータセットである。
本研究は,MLRMにおける推論時プライバシーリスクの再評価の必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-04-27T22:26:45Z) - Benchmarking the Spatial Robustness of DNNs via Natural and Adversarial Localized Corruptions [49.546479320670464]
本稿では,セグメンテーションモデルの空間的ロバスト性を評価するための特別な指標を紹介する。
本稿では,モデルロバスト性をより深く理解する手法として,地域対応型マルチアタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック分析を提案する。
その結果、モデルがこれらの2種類の脅威に異なる反応を示すことが明らかとなった。
論文 参考訳(メタデータ) (2025-04-02T11:37:39Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - Image-Based Geolocation Using Large Vision-Language Models [19.071551941682063]
画像に基づく位置情報の精度を大幅に向上する革新的なフレームワークであるToolを紹介した。
ツールは体系的なチェーン・オブ・シント(CoT)アプローチを採用し、人間のジオゲスティング戦略を模倣する。
GeoGuessrゲームの平均スコアは4550.5で85.37%で、高精度な位置情報予測を行う。
論文 参考訳(メタデータ) (2024-08-18T13:39:43Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - Selective, Interpretable, and Motion Consistent Privacy Attribute Obfuscation for Action Recognition [18.93148005536135]
既存のアプローチは、難読化(obfuscation)によって引き起こされる問題や、解釈可能性の欠如に悩まされることが多い。
人間の選択したプライバシーテンプレートは,属性を選択的に隠蔽し,時間的一貫性を誘導する難読化方式である。
論文 参考訳(メタデータ) (2024-03-19T13:17:26Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Shielding the Unseen: Privacy Protection through Poisoning NeRF with
Spatial Deformation [59.302770084115814]
本稿では,Neural Radiance Fields(NeRF)モデルの生成機能に対して,ユーザのプライバシを保護する革新的な手法を提案する。
我々の新しい中毒攻撃法は、人間の目では認識できないが、NeRFが正確に3Dシーンを再構築する能力を損なうのに十分強力である観察ビューの変化を誘発する。
我々は、高品質の画像を含む29の現実世界シーンからなる2つの共通のNeRFベンチマークデータセットに対して、我々のアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2023-10-04T19:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。