論文の概要: Cross-Modal Transferable Image-to-Video Attack on Video Quality Metrics
- arxiv url: http://arxiv.org/abs/2501.08415v1
- Date: Tue, 14 Jan 2025 20:12:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:53:20.075884
- Title: Cross-Modal Transferable Image-to-Video Attack on Video Quality Metrics
- Title(参考訳): ビデオ品質指標のクロスモーダル・トランスファー可能な画像-映像間攻撃
- Authors: Georgii Gotin, Ekaterina Shumitskaya, Anastasia Antsiferova, Dmitriy Vatolin,
- Abstract要約: 最新の画像品質評価(IQA/VQA)メトリクスは、敵の攻撃に対して脆弱である。
文献で研究されている攻撃のほとんどはホワイトボックス攻撃であり、VQAの文脈におけるブラックボックス攻撃は、あまり注目されていない。
本稿では,現代のVQAモデルの脆弱性の探索を目的としたクロスモーダル攻撃手法IC2VQAを提案する。
- 参考スコア(独自算出の注目度): 3.7855740990304736
- License:
- Abstract: Recent studies have revealed that modern image and video quality assessment (IQA/VQA) metrics are vulnerable to adversarial attacks. An attacker can manipulate a video through preprocessing to artificially increase its quality score according to a certain metric, despite no actual improvement in visual quality. Most of the attacks studied in the literature are white-box attacks, while black-box attacks in the context of VQA have received less attention. Moreover, some research indicates a lack of transferability of adversarial examples generated for one model to another when applied to VQA. In this paper, we propose a cross-modal attack method, IC2VQA, aimed at exploring the vulnerabilities of modern VQA models. This approach is motivated by the observation that the low-level feature spaces of images and videos are similar. We investigate the transferability of adversarial perturbations across different modalities; specifically, we analyze how adversarial perturbations generated on a white-box IQA model with an additional CLIP module can effectively target a VQA model. The addition of the CLIP module serves as a valuable aid in increasing transferability, as the CLIP model is known for its effective capture of low-level semantics. Extensive experiments demonstrate that IC2VQA achieves a high success rate in attacking three black-box VQA models. We compare our method with existing black-box attack strategies, highlighting its superiority in terms of attack success within the same number of iterations and levels of attack strength. We believe that the proposed method will contribute to the deeper analysis of robust VQA metrics.
- Abstract(参考訳): 近年の研究では、画像品質評価(IQA/VQA)の指標が敵の攻撃に対して脆弱であることが示されている。
攻撃者は、前処理によってビデオを操作でき、実際の視覚的品質の改善にもかかわらず、特定の基準に従って、その品質スコアを人工的に向上させることができる。
文献で研究されている攻撃のほとんどはホワイトボックス攻撃であり、VQAの文脈におけるブラックボックス攻撃は、あまり注目されていない。
さらに、VQAに適用した場合、あるモデルから別のモデルへの逆例の転送可能性の欠如を示す研究もある。
本稿では,現代のVQAモデルの脆弱性の探索を目的とした,クロスモーダル攻撃手法IC2VQAを提案する。
このアプローチは、画像やビデオの低レベル特徴空間が類似しているという観察によって動機付けられている。
本稿では,異なるモードの対向摂動の伝達可能性について検討し,特に,CLIPモジュールを付加したWhite-box IQAモデル上で発生する対向摂動が,VQAモデルを効果的にターゲットする方法について分析する。
CLIPモジュールの追加は、CLIPモデルが低レベルのセマンティクスを効果的に取得したことで知られており、転送可能性を高める上で貴重な助けとなる。
大規模な実験により、IC2VQAは3つのブラックボックスVQAモデルに対する攻撃において高い成功率を達成することが示された。
提案手法を既存のブラックボックス攻撃戦略と比較し,同じ回数の反復と攻撃強度のレベルにおける攻撃成功の観点から,その優位性を強調した。
提案手法は,ロバストなVQAメトリクスのより深い分析に寄与すると考えられる。
関連論文リスト
- Secure Video Quality Assessment Resisting Adversarial Attacks [14.583834512620024]
近年の研究では、既存のVQAモデルの敵攻撃に対する脆弱性が明らかにされている。
本稿では,既存のVQAモデルにセキュリティを持たせることを目的とした,一般敵防衛の原則について検討する。
セキュリティ指向の観点から,SecureVQAと呼ばれる新しいVQAフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-09T13:27:06Z) - AdvQDet: Detecting Query-Based Adversarial Attacks with Adversarial Contrastive Prompt Tuning [93.77763753231338]
CLIP画像エンコーダを微調整し、2つの中間対向クエリに対して同様の埋め込みを抽出するために、ACPT(Adversarial Contrastive Prompt Tuning)を提案する。
我々は,ACPTが7つの最先端クエリベースの攻撃を検出できることを示す。
また,ACPTは3種類のアダプティブアタックに対して堅牢であることを示す。
論文 参考訳(メタデータ) (2024-08-04T09:53:50Z) - Black-box Adversarial Attacks Against Image Quality Assessment Models [16.11900427447442]
No-Reference Image Quality Assessment (NR-IQA)の目標は、画像の知覚的品質を主観的評価に従って予測することである。
本稿では,NR-IQAモデルに対するブラックボックス攻撃を初めて検討する。
論文 参考訳(メタデータ) (2024-02-27T14:16:39Z) - AICAttack: Adversarial Image Captioning Attack with Attention-Based Optimization [13.045125782574306]
本稿では,画像上の微妙な摂動によって画像キャプションモデルを攻撃する新たな攻撃戦略であるAICAttackを提案する。
ブラックボックス攻撃シナリオ内で動作するため、我々のアルゴリズムはターゲットモデルのアーキテクチャ、パラメータ、勾配情報へのアクセスを必要としない。
複数の犠牲者モデルに対するベンチマークデータセットの広範な実験を通じて,AICAttackの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-19T08:27:23Z) - VQAttack: Transferable Adversarial Attacks on Visual Question Answering
via Pre-trained Models [58.21452697997078]
本稿では,画像とテキストの摂動を設計モジュールで生成できる新しいVQAttackモデルを提案する。
5つの検証モデルを持つ2つのVQAデータセットの実験結果は、提案したVQAttackの有効性を示す。
論文 参考訳(メタデータ) (2024-02-16T21:17:42Z) - Vulnerabilities in Video Quality Assessment Models: The Challenge of
Adversarial Attacks [15.127749101160672]
No-Reference Video Quality Assessment (NR-VQA) は,エンドユーザの視聴体験を改善する上で重要な役割を担っている。
近年,CNN と Transformer をベースとした NR-VQA モデルは優れた性能を発揮している。
敵攻撃に対するNR-VQAモデルの堅牢性を評価するための最初の試みを行う。
論文 参考訳(メタデータ) (2023-09-24T11:17:38Z) - Set-level Guidance Attack: Boosting Adversarial Transferability of
Vision-Language Pre-training Models [52.530286579915284]
本稿では,視覚言語事前学習モデルの対角移動可能性について検討する。
伝達性劣化は、部分的にはクロスモーダル相互作用のアンダーユース化によって引き起こされる。
本稿では,高度に伝達可能なSGA(Set-level Guidance Attack)を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:19:21Z) - Inter-frame Accelerate Attack against Video Interpolation Models [73.28751441626754]
我々は,対戦型攻撃をVIFモデルに適用し,対戦型モデルに対して非常に脆弱であることを示す。
本稿では,フレーム間加速攻撃(IAA)と呼ばれる新しい攻撃手法を提案する。
本手法は従来の手法と同等の攻撃性能を達成しつつ,攻撃効率を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-05-11T03:08:48Z) - Practical No-box Adversarial Attacks with Training-free Hybrid Image
Transformation [123.33816363589506]
ノンボックス脅威モデルの下では, テキストbftraining-free adversarial perturbationの存在を示す。
低レベルの特徴を持つ高周波成分 (HFC) ドメインは, 主に周波数成分の操作によって画像を攻撃する。
我々の手法は、主流の転送ベースのブラックボックス攻撃と競合する。
論文 参考訳(メタデータ) (2022-03-09T09:51:00Z) - Cross-Modal Transferable Adversarial Attacks from Images to Videos [82.0745476838865]
近年の研究では、一方のホワイトボックスモデルで手作りされた敵の例は、他のブラックボックスモデルを攻撃するために使用できることが示されている。
本稿では,イメージ・トゥ・ビデオ(I2V)攻撃と呼ばれる,シンプルだが効果的なクロスモーダル・アタック手法を提案する。
I2Vは、事前訓練された画像モデルの特徴と良質な例とのコサイン類似性を最小化して、対向フレームを生成する。
論文 参考訳(メタデータ) (2021-12-10T08:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。