論文の概要: Jailbreaking Multimodal Large Language Models using Multi-Clip Video
- arxiv url: http://arxiv.org/abs/2606.02111v1
- Date: Mon, 01 Jun 2026 11:43:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.894916
- Title: Jailbreaking Multimodal Large Language Models using Multi-Clip Video
- Title(参考訳): マルチクリップビデオによるマルチモーダル大言語モデルのジェイルブレーク
- Authors: Choongwon Kang, Seungjong Sun, Hyunmin Jun, Jang Hyun Kim,
- Abstract要約: 我々は,ビデオ入力の多様性がMLLMの脆弱性に与える影響を評価するために,2,920本の動画のデータセットであるMulti-Clip Video (MCV) SafetyBenchを紹介する。
8つの代表的ビデオMLLMの実験では、クリップ数によって攻撃の成功が一貫して増加することが示されている。
その結果,映像のモダリティは(1)画像のモダリティよりも脆弱であり,(2)静的ビデオよりもダイナミックビデオに脆弱であり,(3)動画がより多様なコンテキストを含む場合,より脆弱であることが示唆された。
- 参考スコア(独自算出の注目度): 2.1309627532459037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As multimodal large language models (MLLMs) have advanced to process video inputs, concerns have emerged about their potential for malicious misuse. Prior jailbreak studies have shown that safety alignment in MLLMs can be bypassed through visual inputs, yet it remains unclear which properties of video inputs induce this vulnerability. To address this gap, we introduce Multi-Clip Video (MCV) SafetyBench, a dataset of 2,920 videos designed to evaluate how the diversity of video inputs affects the vulnerability of MLLMs. Each video consists of multiple short clips depicting diverse contexts related to a harmful query. Experiments on eight representative video MLLMs show that attack success consistently increases with the number of clips. Our results further indicate that the video modality is (1) more vulnerable than the image modality, (2) more vulnerable to dynamic videos than to static videos, and (3) more vulnerable when videos contain more diverse contexts. Building on these findings, we propose a defense strategy that leverages the relative robustness of the image modality.
- Abstract(参考訳): マルチモーダルな大言語モデル(MLLM)はビデオ入力を処理するために進歩してきたため、悪意のある誤用の可能性について懸念が高まっている。
以前のジェイルブレイク研究では、MLLMの安全アライメントは視覚入力によってバイパス可能であることが示されているが、ビデオ入力のどの特性がこの脆弱性を引き起こすかは定かではない。
このギャップに対処するために,ビデオ入力の多様性がMLLMの脆弱性に与える影響を評価するために設計された,2,920本のビデオのデータセットであるMulti-Clip Video (MCV) SafetyBenchを紹介する。
各ビデオは、有害なクエリに関連するさまざまなコンテキストを描写した複数の短いクリップで構成されている。
8つの代表的ビデオMLLMの実験では、クリップ数によって攻撃の成功が一貫して増加することが示されている。
さらに,ビデオのモダリティは,(1)画像のモダリティよりも脆弱であり,(2)静的なビデオよりもダイナミックなビデオに対して脆弱であり,(3)ビデオがより多様なコンテキストを含む場合,より脆弱であることを示す。
これらの知見に基づいて,画像の相対的ロバスト性を活用する防衛戦略を提案する。
関連論文リスト
- Watch, Listen, Understand, Mislead: Tri-modal Adversarial Attacks on Short Videos for Content Appropriateness Evaluation [1.0012740151280692]
本稿では,マルチモーダル大言語モデル(MLLM)の3次元安全性を評価するためのフレームワークを提案する。
本稿では,ヒト誘導型合成対向攻撃を用いたショートビデオ・マルチモーダル対向データセットを提案する。
最先端MLLMの大規模な実験により、攻撃成功率(ASR)の高い重大な脆弱性が明らかになった。
論文 参考訳(メタデータ) (2025-07-16T07:02:15Z) - Vid-SME: Membership Inference Attacks against Large Video Understanding Models [56.31088116526825]
ビデオ理解モデル(VULLM)で使用されるビデオデータに適した,最初の会員推論手法であるVid-SMEを紹介する。
自然なビデオフレームと時間的に反転したビデオフレームのSME差を利用して、Vid-SMEは、与えられたビデオがモデルのトレーニングセットの一部であるかどうかを判断するロバストなメンバーシップスコアを導出する。
様々な自己学習およびオープンソースVULLMの実験は、Vid-SMEの強力な有効性を示している。
論文 参考訳(メタデータ) (2025-05-29T13:17:25Z) - Video-SafetyBench: A Benchmark for Safety Evaluation of Video LVLMs [45.265397990158846]
Video-SafetyBenchは、ビデオテキスト攻撃下でのLVLMの安全性を評価するために設計された最初のベンチマークである。
ビデオテキストのペアは2,264で、48のきめ細かいアンセーフなカテゴリにまたがっている。
安全性評価のためのセマンティックなビデオを生成するために,ビデオ意味論を主題画像とモーションテキストに分解する制御可能なパイプラインを設計する。
論文 参考訳(メタデータ) (2025-05-17T05:06:38Z) - Image-based Multimodal Models as Intruders: Transferable Multimodal Attacks on Video-based MLLMs [48.76864299749205]
ビデオベースの大規模言語モデル(V-MLLM)は、ビデオテキストマルチモーダルタスクにおける逆例の脆弱性を示す。
本稿では,V-MLLM間の対向映像の転送可能性について検討する。
論文 参考訳(メタデータ) (2025-01-02T03:52:22Z) - Video Watermarking: Safeguarding Your Video from (Unauthorized) Annotations by Video-based LLMs [43.83499677307886]
ビデオウォーターマーキング(英語: Video Watermarking)は、ビデオベースの大規模言語モデルによって、未承認のアノテーションからビデオを保護する技術である。
ビデオによるLLMの誤使用を防止しつつ視聴体験を保存している。
論文 参考訳(メタデータ) (2024-07-02T16:34:14Z) - FMM-Attack: A Flow-based Multi-modal Adversarial Attack on Video-based LLMs [57.59518049930211]
本稿では,ビデオベース大規模言語モデル (LLM) に適した最初の敵攻撃を提案する。
我々の攻撃は、ビデオに知覚不能な逆方向の摂動を加えると、ビデオベースのLCMを効果的に誘導し、誤った回答を発生させる。
我々のFMM-Attackは、モデル出力のギャンブルを誘導し、ビデオベースのLCMを幻覚させる。
論文 参考訳(メタデータ) (2024-03-20T11:05:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。