論文の概要: PHANTOM: A Large-Scale Dataset of Multimodal Adversarial Attacks for Vision-Language Models
- arxiv url: http://arxiv.org/abs/2606.24388v1
- Date: Tue, 23 Jun 2026 10:20:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.89872
- Title: PHANTOM: A Large-Scale Dataset of Multimodal Adversarial Attacks for Vision-Language Models
- Title(参考訳): PHANTOM:ビジョンランゲージモデルのための大規模マルチモーダルアタックデータセット
- Authors: Simone Gallivanone, Hossein Khodadadi, Mauro Dore, Mauro Medda, Nicola Franco,
- Abstract要約: 本稿では,視覚言語モデル(VLM)に対する,事前生成した敵攻撃の大規模かつオープンソースデータセットを提案する。
このデータセットは、有害なインテントの10の高レベルカテゴリと55のサブカテゴリをカバーすることで、多様な、代表的で実用的な、既存のベンチマークを拡張するように設計されている。
このデータセットは、最近の文献から最先端の攻撃戦略を用いて生成された、47の524対逆サンプルからなる。
- 参考スコア(独自算出の注目度): 0.815557531820863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a large-scale, open-source dataset of pre-generated adversarial attacks for vision-language models (VLMs). The dataset is designed to be diverse, representative, and practical, extending existing benchmarks by covering 10 high-level categories and 55 subcategories of harmful intents. Our primary goal is to make adversarial data accessible to the research community, given the computational cost and complexity of generating large numbers of attacks. The dataset comprises 47 524 adversarial samples, generated using state-of-the-art attack strategies from recent literature. Our work complements existing efforts by consolidating and extending prior benchmarks from multiple established sources, resulting in 7 826 intents, and introduce an additional category to broaden coverage. This provides realistic evaluation resources for studying model robustness and alignment. Our dataset intends to enable researchers and practitioners to systematically evaluate the robustness and safety of VLMs, fine-tune attack-generation models, and develop or stress-test defensive guardrails under diverse adversarial conditions. By releasing this resource, we aim to lower the barrier to adversarial research and foster more reproducible, comprehensive, and comparable evaluations of VLM safety.
- Abstract(参考訳): 本稿では,視覚言語モデル(VLM)に対して,事前生成した敵攻撃の大規模かつオープンソースのデータセットを提案する。
このデータセットは、有害なインテントの10の高レベルカテゴリと55のサブカテゴリをカバーすることで、多様な、代表的で実用的な、既存のベンチマークを拡張するように設計されている。
我々の第一の目的は、大量の攻撃を発生させる計算コストと複雑さを考えれば、研究コミュニティに敵対的なデータをアクセスできるようにすることです。
このデータセットは、最近の文献から最先端の攻撃戦略を用いて生成された、47の524対逆サンプルからなる。
我々の研究は、既存のベンチマークを複数の確立されたソースから統合し、拡張することで、既存の取り組みを補完し、その結果、7つの826の意図が生まれ、カバー範囲を広げるための追加のカテゴリが導入されます。
これは、モデルの堅牢性とアライメントを研究するための現実的な評価リソースを提供する。
本データセットは, VLMの堅牢性と安全性, 微動攻撃発生モデル, 各種対向条件下での防御レールの開発, およびストレス試験を行うためのものである。
このリソースを公開することによって、敵研究の障壁を低くし、より再現性が高く、包括的で、VLM安全性に匹敵する評価を促進することを目指している。
関連論文リスト
- Task-Agnostic Attacks Against Vision Foundation Models [12.487589700031661]
機械学習の実践者が利用可能なトレーニング済みのビジョン基礎モデルを採用するのが、標準のプラクティスになっている。
このような基盤モデルに対する攻撃の研究と、複数の下流タスクに対するその影響は、いまだに明らかにされていない。
本研究は,基本モデルを用いて得られた特徴表現を極大に破壊することにより,タスク非依存の敵例を定式化する汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-05T19:15:14Z) - Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety [296.5392512998251]
我々は、敵攻撃、データ中毒、バックドア攻撃、ジェイルブレイクとプロンプトインジェクション攻撃、エネルギー遅延攻撃、データとモデル抽出攻撃、出現するエージェント固有の脅威を含む、大規模なモデルに対する安全脅威の包括的分類を提示する。
我々は、大規模なモデル安全性におけるオープンな課題を特定し、議論し、包括的な安全性評価、スケーラブルで効果的な防御機構、持続可能なデータプラクティスの必要性を強調します。
論文 参考訳(メタデータ) (2025-02-02T05:14:22Z) - MEAOD: Model Extraction Attack against Object Detectors [45.817537875368956]
モデル抽出攻撃は、攻撃者が被害者モデルに匹敵する機能を持つ代替モデルを複製することを可能にする。
本稿では,オブジェクト検出モデルに対するMEAODと呼ばれる効果的な攻撃手法を提案する。
10kのクエリ予算の所定の条件下で,抽出性能を70%以上達成する。
論文 参考訳(メタデータ) (2023-12-22T13:28:50Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - Poisoning Attacks and Defenses on Artificial Intelligence: A Survey [3.706481388415728]
データ中毒攻撃は、トレーニングフェーズ中にモデルに供給されたデータサンプルを改ざんして、推論フェーズ中にモデルの精度を低下させる攻撃の一種である。
この研究は、この種の攻撃に対処する最新の文献で見つかった最も関連性の高い洞察と発見をまとめたものである。
実環境下での幅広いMLモデルに対するデータ中毒の影響を比較検討し,本研究の徹底的な評価を行った。
論文 参考訳(メタデータ) (2022-02-21T14:43:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。