論文の概要: A Unified Perspective on Adversarial Membership Manipulation in Vision Models
- arxiv url: http://arxiv.org/abs/2604.02780v1
- Date: Fri, 03 Apr 2026 06:44:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.356569
- Title: A Unified Perspective on Adversarial Membership Manipulation in Vision Models
- Title(参考訳): 視覚モデルにおける敵対的メンバーシップ操作の統一的視点
- Authors: Ruize Gao, Kaiwen Zhou, Yongqiang Chen, Feng Liu,
- Abstract要約: メンバーシップ推論攻撃(MIA)は、特定のデータポイントがモデルのトレーニングセットの一部であるかどうかを判断することを目的としている。
視覚モデルのためのMIAは、これまで見過ごされていた対向面、すなわち対向メンバシップ操作を明らかにする。
- 参考スコア(独自算出の注目度): 24.131216889173952
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Membership inference attacks (MIAs) aim to determine whether a specific data point was part of a model's training set, serving as effective tools for evaluating privacy leakage of vision models. However, existing MIAs implicitly assume honest query inputs, and their adversarial robustness remains unexplored. We show that MIAs for vision models expose a previously overlooked adversarial surface: adversarial membership manipulation, where imperceptible perturbations can reliably push non-member images into the "member" region of state-of-the-art MIAs. In this paper, we provide the first unified perspective on this phenomenon by analyzing its mechanism and implications. We begin by demonstrating that adversarial membership fabrication is consistently effective across diverse architectures and datasets. We then reveal a distinctive geometric signature - a characteristic gradient-norm collapse trajectory - that reliably separates fabricated from true members despite their nearly identical semantic representations. Building on this insight, we introduce a principled detection strategy grounded in gradient-geometry signals and develop a robust inference framework that substantially mitigates adversarial manipulation. Extensive experiments show that fabrication is broadly effective, while our detection and robust inference strategies significantly enhance resilience. This work establishes the first comprehensive framework for adversarial membership manipulation in vision models.
- Abstract(参考訳): メンバーシップ推論攻撃(MIA)は、特定のデータポイントがモデルのトレーニングセットの一部であるかどうかを判断することを目的としており、視覚モデルのプライバシー漏洩を評価する効果的なツールとして機能する。
しかし、既存のMIAは、正直なクエリ入力を暗黙的に仮定し、その逆の堅牢性は未解明のままである。
視覚モデルのためのMIAは、非メンバー像を最先端MIAの「メンバー」領域に確実に押し込むことができる対向的メンバーシップ操作という、これまで見過ごされていた敵面を露呈する。
本稿では,この現象について,そのメカニズムと意味を解析して一貫した視点を提供する。
まず、さまざまなアーキテクチャやデータセットに対して、敵のメンバシップ作成が一貫して有効であることを実証することから始めます。
次に、ほぼ同一の意味表現にもかかわらず、真のメンバーと確実に分離された特異な幾何学的シグネチャ、すなわち、傾き-傾き-傾き-崩壊軌道を明らかにする。
この知見に基づいて、勾配-幾何信号に基づく原理的検出戦略を導入し、敵の操作を著しく軽減する頑健な推論フレームワークを開発する。
広範囲にわたる実験により, 製法は広く有効であることがわかったが, 検出方法と頑健な推論手法はレジリエンスを著しく向上させた。
この研究は、視覚モデルにおける敵メンバーシップ操作のための最初の包括的枠組みを確立する。
関連論文リスト
- A Descriptive Model for Modelling Attacker Decision-Making in Cyber-Deception [0.0]
本稿では,この決定を形作る心理的・戦略的要素を組み込んだ記述モデルを提案する。
このフレームワークは、サイバー詐欺シナリオにおけるエンゲージメント決定を分析するための構造化された方法を提供する。
論文 参考訳(メタデータ) (2025-12-03T10:23:33Z) - P-MIA: A Profiled-Based Membership Inference Attack on Cognitive Diagnosis Models [22.027021891488683]
本論文は,認知診断モデル(CDM)に対するMIA(Community Inference attack)を系統的に調査した最初の事例である。
これらのプラットフォームの説明可能性を利用した,斬新で現実的なグレーボックス脅威モデルを提案する。
モデルの最終予測確率と内部知識状態ベクトルを特徴とするプロファイルベースのMIAフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-06T01:53:04Z) - Automated Detection of Visual Attribute Reliance with a Self-Reflective Agent [58.90049897180927]
視覚モデルにおける視覚的特徴の意図しない依存を検出するための自動フレームワークを提案する。
自己反射エージェントは、モデルが依存する可能性のある視覚特性に関する仮説を生成し、テストする。
我々は,視覚特性の多様さを示すために設計された130モデルの新しいベンチマークに対して,我々のアプローチを評価した。
論文 参考訳(メタデータ) (2025-10-24T17:59:02Z) - RoboView-Bias: Benchmarking Visual Bias in Embodied Agents for Robotic Manipulation [67.38036090822982]
ロボット操作における視覚バイアスの定量化を目的とした,最初のベンチマークであるRoboView-Biasを提案する。
我々は、個々の視覚的要因とその相互作用によって引き起こされるバイアスの堅牢な測定を可能にする2,127のタスクインスタンスを作成します。
本研究は,視覚バイアスの系統的解析が,安全で信頼性の高い汎用的なエンボディエージェントの開発に必須であることを示す。
論文 参考訳(メタデータ) (2025-09-26T13:53:25Z) - Neural Breadcrumbs: Membership Inference Attacks on LLMs Through Hidden State and Attention Pattern Analysis [9.529147118376464]
メンバーシップ推論攻撃(MIA)は、特定のデータが機械学習モデルのトレーニングに使用されたかどうかを明らかにする。
我々の研究は、内部表現を単に出力ではなく検査することで、メンバーシップ推論信号に対するさらなる洞察を与えることができるかを探る。
本研究は,出力に基づく信号が保護された場合でも,内部モデル行動がトレーニングデータの露出の側面を明らかにすることを示唆している。
論文 参考訳(メタデータ) (2025-09-05T19:05:49Z) - MirrorCheck: Efficient Adversarial Defense for Vision-Language Models [55.73581212134293]
本稿では,視覚言語モデルにおける対角的サンプル検出のための,新しい,しかしエレガントなアプローチを提案する。
本手法は,テキスト・トゥ・イメージ(T2I)モデルを用いて,ターゲットVLMが生成したキャプションに基づいて画像を生成する。
異なるデータセットで実施した経験的評価により,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-06-13T15:55:04Z) - Understanding Data Augmentation from a Robustness Perspective [10.063624819905508]
データ拡張は、モデルの堅牢性を増幅するための重要なテクニックとして際立っている。
この写本は、この現象を理解するための理論的および実証的なアプローチを採っている。
我々の経験的評価は、エンブレマ的なデータ拡張戦略の複雑なメカニズムを解明するものである。
これらの洞察は、視覚認識タスクにおけるモデルの安全性と堅牢性を再評価する新しいレンズを提供する。
論文 参考訳(メタデータ) (2023-09-07T10:54:56Z) - PAIF: Perception-Aware Infrared-Visible Image Fusion for Attack-Tolerant
Semantic Segmentation [50.556961575275345]
対向シーンにおけるセグメンテーションの堅牢性を促進するための認識認識型融合フレームワークを提案する。
我々は,先進の競争相手に比べて15.3% mIOUの利得で,ロバスト性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2023-08-08T01:55:44Z) - Weakly-supervised HOI Detection via Prior-guided Bi-level Representation
Learning [66.00600682711995]
ヒューマンオブジェクトインタラクション(HOI)検出は、人間中心のシーン理解において重要な役割を担い、多くの視覚タスクの基本的なビルディングブロックとして機能する。
HOI検出のための汎用的でスケーラブルな戦略の1つは、画像レベルのアノテーションからのみ学習する弱い監視を使用することである。
これは、不明瞭な人間と物体の関連、HOIを検出する大きな探索空間、非常にノイズの多い訓練信号によって本質的に困難である。
画像レベルとHOIインスタンスレベルの両方で事前の知識を組み込むことができるCLIP誘導HOI表現を開発し、不正な人間とオブジェクトの関連性を実証するために自己学習機構を採用する。
論文 参考訳(メタデータ) (2023-03-02T14:41:31Z) - Detection Defense Against Adversarial Attacks with Saliency Map [7.736844355705379]
ニューラルネットワークは、人間の視覚にほとんど受容できない敵の例に弱いことがよく確認されている。
既存の防衛は、敵の攻撃に対するモデルの堅牢性を強化する傾向にある。
本稿では,新たな雑音と組み合わせた新しい手法を提案し,不整合戦略を用いて敵のサンプルを検出する。
論文 参考訳(メタデータ) (2020-09-06T13:57:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。