論文の概要: Adversarial Attacks Against MLLMs via Progressive Resolution Processing and Adaptive Feature Alignment
- arxiv url: http://arxiv.org/abs/2605.09902v1
- Date: Mon, 11 May 2026 02:45:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.479656
- Title: Adversarial Attacks Against MLLMs via Progressive Resolution Processing and Adaptive Feature Alignment
- Title(参考訳): プログレッシブ・レゾリューション処理と適応的特徴アライメントによるMLLMの逆攻撃
- Authors: Haobo Wang, Xiaorong Ma, Weiqi Luo, Xiaojun Jia, Jiwu Huang,
- Abstract要約: 敵対的摂動は、特定の対象物として良性画像を認識するマルチモーダル大言語モデル(MLLM)を誤解させる可能性がある。
これにより、ブラックボックスMLLMの堅牢性を理解し改善するために、転送ベースのターゲットアタックが重要である。
マルチスケールなグローバルなセマンティックガイダンスとロバストな中間層局所アライメントを統合した,トランスファーベースの攻撃フレームワークであるPRAF-Attackを提案する。
- 参考スコア(独自算出の注目度): 56.085182951399496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adversarial perturbations can mislead Multimodal Large Language Models (MLLMs) recognize a benign image as a specific target object, posing serious risks in safety-critical scenarios such as autonomous driving and medical diagnosis. This makes transfer-based targeted attacks crucial for understanding and improving black-box MLLM robustness. Existing transfer-based targeted attack methods typically rely on the final global features of the surrogate encoder and anchor optimization to original-resolution target crops, leading to their limited transferability and robustness. To address these challenges, we propose Progressive Resolution Processing and Adaptive Feature Alignment (PRAF-Attack), a targeted transfer-based attack framework that integrates multi-scale global semantic guidance with robust intermediate-layer local alignment. Unlike prior methods that align only the surrogate encoder's final layer, we design an adaptive feature alignment strategy that leverages intermediate representations to enhance transferability. Specifically, we introduce an adaptive intermediate layer selection mechanism to identify transferable hierarchical features across surrogate ensembles via gradient consistency, along with an adaptive patch-level optimization strategy that preserves highly correlated local regions through efficient patch filtering. To overcome the reliance on fixed original-resolution target crops, we propose a progressive resolution processing strategy that gradually refines optimization from coarse to fine, enabling the attack to better exploit target information at multiple scales and achieve stronger transferability. We evaluate PRAF-Attack on a diverse suite of black-box MLLMs, including six open-source models and six closed-source commercial APIs. Compared with seven state-of-the-art targeted attack baselines, the proposed PRAF-Attack consistently achieves superior transferability.
- Abstract(参考訳): 敵対的摂動は、マルチモーダル大言語モデル(MLLM)が特定の対象物として良質なイメージを認識することを誤解させ、自律運転や診断などの安全上重要なシナリオに重大なリスクをもたらす可能性がある。
これにより、ブラックボックスMLLMの堅牢性を理解し改善するために、転送ベースのターゲットアタックが重要である。
既存のトランスファーベースの攻撃手法は、通常、サロゲートエンコーダの最終的なグローバルな特徴と、オリジナル解像度のターゲット作物へのアンカー最適化に依存しており、転送可能性とロバスト性に制限がある。
これらの課題に対処するために,多スケールなグローバルなセマンティックガイダンスとロバストな中間層局所アライメントを統合したトランスファーベースの攻撃フレームワークであるProgressive Resolution Processing and Adaptive Feature Alignment (PRAF-Attack)を提案する。
代用エンコーダの最終層のみをアライメントする従来の手法とは異なり、中間表現を利用した適応的特徴アライメント戦略を設計し、転送可能性を高める。
具体的には,アダプティブ・中間層選択機構を導入し,アダプティブ・パッチ・レベル最適化手法と,アダプティブ・パッチ・レベル最適化手法を併用し,アダプティブ・パッチ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダプティブ・アダクティブ・アダクティカル・アダクティカル・アダクティカル・アダクティカル・アダクティカル・アジェンス・アレンブルス
固定されたオリジナル解像度のターゲット作物への依存を克服するため、我々は、最適化を粗いものから細かいものへと徐々に洗練し、ターゲット情報を複数スケールでよりうまく活用し、より強力な転送性を実現するプログレッシブ・レゾリューション・プロセッシング戦略を提案する。
PRAF-Attackは6つのオープンソースモデルと6つのクローズドソース商用APIを含む多様なブラックボックスMLLMで評価する。
7つの最先端の攻撃ベースラインと比較して、提案されたPRAF-Attackは一貫して優れた転送性を実現している。
関連論文リスト
- AnchorRefine: Synergy-Manipulation Based on Trajectory Anchor and Residual Refinement for Vision-Language-Action Models [60.04879435087352]
視覚言語アクション(VLA)ポリシーは、単一の統一空間内でアクションを生成する。
本稿では,VLAの動作モデリングを軌跡アンカーと残留精細化に分解する階層的フレームワークであるAnchorRefineを提案する。
LIBERO、CALVIN、および実ロボットタスクの実験では、AnchorRefineは回帰ベースと拡散ベースの両方のVLAバックボーンを一貫して改善している。
論文 参考訳(メタデータ) (2026-04-20T04:25:24Z) - SGHA-Attack: Semantic-Guided Hierarchical Alignment for Transferable Targeted Attacks on Vision-Language Models [73.19044613922911]
大規模視覚言語モデル(VLM)は、転送ベースの対向摂動に対して脆弱である。
SGHA-Attackは、複数のターゲット参照を採用し、中間層一貫性を強制するフレームワークである。
オープンソースおよび商用のブラックボックスVLMの実験は、SGHA-Attackが従来の方法よりも強力な目標転送性を実現することを示している。
論文 参考訳(メタデータ) (2026-02-02T03:10:41Z) - Make Anything Match Your Target: Universal Adversarial Perturbations against Closed-Source MLLMs via Multi-Crop Routed Meta Optimization [49.30177419529011]
我々は、より厳密な設定であるユニバーサル・ターゲティング・トランスファラブル・アタック(UTTAA)について研究する。
単一の摂動は、未知の商用MLLMをまたいで、指定されたターゲットに対する任意の入力を常に制御しなければならない。
本稿では,M CRMO-Attackを提案する。
論文 参考訳(メタデータ) (2026-01-30T17:03:24Z) - MAESTRO: Meta-learning Adaptive Estimation of Scalarization Trade-offs for Reward Optimization [56.074760766965085]
大規模言語モデル(LLM)の整合性のための効率的なパラダイムとしてグループ相対政策最適化が登場している。
我々は,報酬スカラー化を動的潜在ポリシーとして扱い,モデルの終端隠蔽状態を意味的ボトルネックとして活用するMAESTROを提案する。
本稿では,軽量コンダクタネットワークがメタリワード信号としてグループ相対的優位性を生かしてポリシと共進化する,双方向最適化フレームワークにおけるコンテキスト的帯域幅問題としてこれを定式化する。
論文 参考訳(メタデータ) (2026-01-12T05:02:48Z) - Adversarial Attacks against Closed-Source MLLMs via Feature Optimal Alignment [35.77916460821855]
マルチモーダル大規模言語モデル(MLLM)は、移動可能な敵攻撃に対して脆弱である。
本稿では,特徴量の最適アライメントに基づく移動可能な対向攻撃手法を提案する。
実験は,提案手法の優位性を実証し,最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-05-27T17:56:57Z) - HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization [55.972018549438964]
LLM(Federated Fine-tuning of Pre-trained Large Language Models)は、さまざまなデータセットにまたがるタスク固有の適応を可能にすると同時に、プライバシの保護を可能にする。
本研究では, HAFLQ (Heterogeneous Adaptive Federated Low-Rank Adaptation Fine-tuned LLM with Quantization) を提案する。
テキスト分類タスクの実験結果から,HAFLQはメモリ使用量を31%削減し,通信コストを49%削減し,精度を50%向上し,ベースライン法よりも高速な収束を実現している。
論文 参考訳(メタデータ) (2024-11-10T19:59:54Z) - Pareto Domain Adaptation [35.48609986914723]
ドメイン適応(DA)は、ラベル付きソースドメインからラベルなしターゲットドメインへの知識の転送を試みる。
本研究は,全学習目標を協調的に最適化することを目的とした,全体の最適化方向を制御するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-12-08T06:31:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。