Fugu-MT 論文翻訳(概要): Empirical Analysis of Large Vision-Language Models against Goal Hijacking via Visual Prompt Injection

論文の概要: Empirical Analysis of Large Vision-Language Models against Goal Hijacking via Visual Prompt Injection

arxiv url: http://arxiv.org/abs/2408.03554v1
Date: Wed, 7 Aug 2024 05:30:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-08 13:53:42.509063
Title: Empirical Analysis of Large Vision-Language Models against Goal Hijacking via Visual Prompt Injection
Title（参考訳）: 視覚プロンプト注入によるゴールハイジャックに対する大規模視線モデルの実験的検討
Authors: Subaru Kimura, Ryota Tanaka, Shumpei Miyawaki, Jun Suzuki, Keisuke Sakaguchi,
Abstract要約: 視覚的プロンプト注入によるゴールハイジャック法(GHVPI)を提案する。 GPT-4VはGHVPIに対して脆弱であり、攻撃成功率は15.8%であることを示す。
参考スコア（独自算出の注目度）: 27.747517031659953
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We explore visual prompt injection (VPI) that maliciously exploits the ability of large vision-language models (LVLMs) to follow instructions drawn onto the input image. We propose a new VPI method, "goal hijacking via visual prompt injection" (GHVPI), that swaps the execution task of LVLMs from an original task to an alternative task designated by an attacker. The quantitative analysis indicates that GPT-4V is vulnerable to the GHVPI and demonstrates a notable attack success rate of 15.8%, which is an unignorable security risk. Our analysis also shows that successful GHVPI requires high character recognition capability and instruction-following ability in LVLMs.
Abstract（参考訳）: 入力画像上に描画された指示に従うために,大規模視覚言語モデル(LVLM)を悪用する視覚的プロンプトインジェクション(VPI)について検討する。本稿では,LVLMの実行タスクを元のタスクから攻撃者が指定した代替タスクに置き換える新しいVPI手法「GHVPI(Goal Hijacking via visual prompt Injection)」を提案する。定量的分析により、GPT-4VはGHVPIに弱いことが示され、15.8%の攻撃成功率を示す。また,GHVPIを成功させるためには,LVLMにおいて高い文字認識能力と命令追従能力が必要であることを示した。

関連論文リスト

Physical Prompt Injection Attacks on Large Vision-Language Models [21.694496200641794]
LVLM(Large-Language Models)は、オープンな物理的環境での知覚と推論のために、現実世界のインテリジェントシステムにますます多くデプロイされている。 LVLMによって知覚される物理的物体に悪質なタイポグラフィー命令を埋め込むブラックボックス攻撃であるPhysical Prompt Injection Attack (PPIA)を提案する。我々は,視覚的質問応答,計画,ナビゲーション,PPIA攻撃成功率最大98%といった実世界のタスクにおいて,10の最先端LVLMのPPIAを評価した。
論文参考訳（メタデータ） (2026-01-24T09:13:28Z)
VEAttack: Downstream-agnostic Vision Encoder Attack against Large Vision Language Models [33.120141513366136]
LVLM(Large Vision-Language Models)は、マルチモーダル理解と生成において顕著な能力を示す。既存の効果的な攻撃は常にタスク固有のホワイトボックス設定に集中する。我々は,LVLMのビジョンエンコーダのみをターゲットとした,シンプルで効果的なビジョンアタック(VEAttack)を提案する。
論文参考訳（メタデータ） (2025-05-23T03:46:04Z)
Exploring Typographic Visual Prompts Injection Threats in Cross-Modality Generation Models [24.076565048125975]
Vision-Language Perceptionと Image-to-Imageを含むクロスビジョンが注目されている。従来の研究では、入力画像にタイポグラフィー語を印刷すると、LVLMやI2I GMが顕著に誘導され、それらの単語に意味のある破壊的な出力が生成されることが示されている。視覚的プロンプトは、タイポグラフィーのより洗練された形態として、画像に注入された時に生成タスクの様々なアプリケーションにセキュリティ上のリスクをもたらすことが明らかにされている。
論文参考訳（メタデータ） (2025-03-14T15:42:42Z)
How Blind and Low-Vision Individuals Prefer Large Vision-Language Model-Generated Scene Descriptions [38.22472823480205]
LVLM(Large Vision-Language Models)はシーン記述の生成を約束するが,BLVユーザに対する有効性は未定である。 8人のBLV参加者とユーザスタディを行い、6種類のLVLM記述の好みを体系的に評価した。彼らは恐怖を減らし、行動可能性を向上させるのに役立ったが、ユーザーの評価は、満足度と簡潔さの幅広いバリエーションを示した。
論文参考訳（メタデータ） (2025-02-15T10:17:52Z)
Document Screenshot Retrievers are Vulnerable to Pixel Poisoning Attacks [72.4498910775871]
ヴィジュアル言語モデル(VLM)ベースのレトリバーは、ベクターとして埋め込まれた文書のスクリーンショットを活用して、効率的な検索を可能にし、従来のテキストのみの手法よりも単純化されたパイプラインを提供する。本研究では,VLMをベースとしたレトリバーを危険にさらすために,3つのピクセル中毒攻撃手法を提案する。
論文参考訳（メタデータ） (2025-01-28T12:40:37Z)
Attention Tracker: Detecting Prompt Injection Attacks in LLMs [62.247841717696765]
大型言語モデル (LLM) は様々なドメインに革命をもたらしたが、インジェクション攻撃に弱いままである。そこで本研究では,特定の注意点が本来の指示から注入指示へと焦点を移す,注意散逸効果の概念を紹介した。本研究では,アテンション・トラッカーを提案する。アテンション・トラッカーは,インジェクション・アタックを検出するために,インストラクション上の注意パターンを追跡する訓練不要な検出手法である。
論文参考訳（メタデータ） (2024-11-01T04:05:59Z)
A Survey of Attacks on Large Vision-Language Models: Resources, Advances, and Future Trends [78.3201480023907]
LVLM(Large Vision-Language Models)は、多モーダルな理解と推論タスクにまたがる顕著な能力を示す。 LVLMの脆弱性は比較的過小評価されており、日々の使用において潜在的なセキュリティリスクを生じさせる。本稿では,既存のLVLM攻撃の様々な形態について概説する。
論文参考訳（メタデータ） (2024-07-10T06:57:58Z)
Safety Alignment for Vision Language Models [21.441662865727448]
安全モジュールの追加により視覚言語モデル(VLM)の視覚的モダリティ安全アライメントを強化する。提案手法は使いやすさ,高い柔軟性,強力な制御性を備え,モデル全体の性能に最小限の影響を与えながら安全性を向上させる。
論文参考訳（メタデータ） (2024-05-22T12:21:27Z)
Safeguarding Vision-Language Models Against Patched Visual Prompt Injectors [31.383591942592467]
視覚言語モデル(VLM)は、視覚とテキストのデータを組み合わせて理解と相互作用を強化する革新的な方法を提供する。パッチベースの敵攻撃は、物理的な視覚応用において最も現実的な脅威モデルと考えられている。本研究では,スムージング技術に根ざした防御機構であるSmoothVLMを導入し,VLMをパッチ付き視覚プロンプトインジェクタの脅威から保護する。
論文参考訳（メタデータ） (2024-05-17T04:19:19Z)
AVIBench: Towards Evaluating the Robustness of Large Vision-Language Model on Adversarial Visual-Instructions [52.9787902653558]
LVLM(Large Vision-Language Models)は、視覚的インストラクションに対するユーザからの対応において、大きな進歩を見せている。 LVLMのこのような脅威に対する堅牢性の重要性にもかかわらず、この分野の現在の研究は限られている。 AVIBenchは、様々な対向的な視覚的命令に直面した場合のLVLMの堅牢性を分析するために設計されたフレームワークである。
論文参考訳（メタデータ） (2024-03-14T12:51:07Z)
VL-Trojan: Multimodal Instruction Backdoor Attacks against Autoregressive Visual Language Models [65.23688155159398]
VLM(Autoregressive Visual Language Models)は、マルチモーダルなコンテキストにおいて、驚くべき数ショットの学習機能を示す。近年,マルチモーダル・インストラクション・チューニングが提案されている。敵は、指示や画像に埋め込まれたトリガーで有毒なサンプルを注入することで、バックドアを埋め込むことができる。本稿では,マルチモーダルなバックドア攻撃,すなわちVL-Trojanを提案する。
論文参考訳（メタデータ） (2024-02-21T14:54:30Z)
Pre-trained Trojan Attacks for Visual Recognition [106.13792185398863]
PVM(Pre-trained Vision Model)は、下流タスクを微調整する際、例外的なパフォーマンスのため、主要なコンポーネントとなっている。本稿では,PVMにバックドアを埋め込んだトロイの木馬攻撃を提案する。バックドア攻撃の成功において、クロスタスクアクティベーションとショートカット接続がもたらす課題を強調します。
論文参考訳（メタデータ） (2023-12-23T05:51:40Z)
InstructTA: Instruction-Tuned Targeted Attack for Large Vision-Language Models [13.21813503235793]
大規模視覚言語モデル(LVLM)は、画像理解と応答生成において、その驚くべき能力を示した。本稿では,被害者LVLMの視覚エンコーダのみを敵が知ることのできる,新規で実用的な攻撃シナリオを定式化する。本研究では,LVLMに対して高い転送性を有する目標対向攻撃を実現するために,命令調整型ターゲットアタック(dubed textscInstructTA)を提案する。
論文参考訳（メタデータ） (2023-12-04T13:40:05Z)
FigStep: Jailbreaking Large Vision-language Models via Typographic Visual Prompts [14.948652267916149]
大規模視覚言語モデル(VLM)に対するジェイルブレイクアルゴリズムであるFigStepを提案する。 FigStepはテキストに有害な指示を直接送る代わりに、タイポグラフィーによって有害なコンテンツを画像に変換する。 FigStepは10のトピックで500の有害なクエリに対して平均82.50%の攻撃成功率を達成することができる。
論文参考訳（メタデータ） (2023-11-09T18:59:11Z)
On Evaluating Adversarial Robustness of Large Vision-Language Models [64.66104342002882]
大規模視覚言語モデル(VLM)のロバスト性を,最も現実的で高リスクな環境で評価する。特に,CLIP や BLIP などの事前学習モデルに対して,まず攻撃対象のサンプルを作成する。これらのVLM上のブラックボックスクエリは、ターゲットの回避の効果をさらに向上させることができる。
論文参考訳（メタデータ） (2023-05-26T13:49:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。