Fugu-MT 論文翻訳(概要): SNEAK: Synonymous Sentences-Aware Adversarial Attack on Natural Language Video Localization

論文の概要: SNEAK: Synonymous Sentences-Aware Adversarial Attack on Natural Language Video Localization

arxiv url: http://arxiv.org/abs/2112.04154v1
Date: Wed, 8 Dec 2021 07:54:03 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-09 13:49:54.813118
Title: SNEAK: Synonymous Sentences-Aware Adversarial Attack on Natural Language Video Localization
Title（参考訳）: SNEAK: 自然言語ビデオのローカライゼーションにおける同義語文のアタック
Authors: Wenbo Gou, Wen Shi, Jian Lou, Lijie Huang, Pan Zhou, Ruixuan Li
Abstract要約: 自然言語ビデオのローカライゼーション(NLVL)は視覚言語理解領域において重要な課題である。そこで本研究では,NLVLに対する文認識攻撃という新たな逆攻撃パラダイムを提案する。
参考スコア（独自算出の注目度）: 45.99981379514625
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Natural language video localization (NLVL) is an important task in the vision-language understanding area, which calls for an in-depth understanding of not only computer vision and natural language side alone, but more importantly the interplay between both sides. Adversarial vulnerability has been well-recognized as a critical security issue of deep neural network models, which requires prudent investigation. Despite its extensive yet separated studies in video and language tasks, current understanding of the adversarial robustness in vision-language joint tasks like NLVL is less developed. This paper therefore aims to comprehensively investigate the adversarial robustness of NLVL models by examining three facets of vulnerabilities from both attack and defense aspects. To achieve the attack goal, we propose a new adversarial attack paradigm called synonymous sentences-aware adversarial attack on NLVL (SNEAK), which captures the cross-modality interplay between the vision and language sides.
Abstract（参考訳）: 自然言語ビデオローカライズ(nlvl)は視覚言語理解領域において重要なタスクであり、コンピュータビジョンと自然言語側だけでなく、より重要なことに両サイド間の相互作用を深く理解する必要がある。敵対的脆弱性は、深層ニューラルネットワークモデルの重要なセキュリティ問題として認識されている。ビデオや言語タスクにおいて広く研究されているにもかかわらず、NLVLのような視覚言語の共同作業における対角的堅牢性の現在の理解は、あまり発達していない。そこで本研究では,NLVLモデルに対して,攻撃面と防御面の両方から,脆弱性の3つの側面を調べることで,敵のロバスト性を包括的に調査することを目的とする。そこで本研究では,nlvl (sneak) に対する同義語文認識攻撃と呼ばれる,視覚と言語間の相互モダリティを捉える新しい攻撃パラダイムを提案する。

関連論文リスト

Large Language Model Adversarial Landscape Through the Lens of Attack Objectives [13.847214147036226]
大規模言語モデル(LLM)は、人工知能における変革的な飛躍を表している。 LLMは、プライバシー、信頼性、セキュリティ、信頼性を脅かす様々な敵攻撃に対して、ますます脆弱になっている。
論文参考訳（メタデータ） (2025-02-05T07:54:07Z)
Adversarial Attacks of Vision Tasks in the Past 10 Years: A Survey [21.4046846701173]
敵対的攻撃は、機械学習推論中に重大なセキュリティ脅威を引き起こす。既存のレビューは、しばしば攻撃分類に焦点を合わせ、包括的で詳細な分析を欠いている。本稿は、従来のLVLM攻撃とLVLM攻撃の包括的概要を提供することによって、これらのギャップに対処する。
論文参考訳（メタデータ） (2024-10-31T07:22:51Z)
Backdooring Vision-Language Models with Out-Of-Distribution Data [44.40928756056506]
視覚言語モデル(VLM)は視覚入力から詳細なテキスト記述を生成する。重要性は増しているが、特にバックドア攻撃に対するVLMの安全性は検討中である。 VLOOD(Backdooring Vision-Language Models with Out-of-Distribution Data)は、2つの重要なコントリビューションを持つ新しいアプローチである。
論文参考訳（メタデータ） (2024-10-02T06:21:00Z)
TrojVLM: Backdoor Attack Against Vision Language Models [50.87239635292717]
本研究では、視覚言語モデル(VLM)を対象としたバックドアアタックの最初の調査であるTrojVLMを紹介する。 TrojVLMは、有毒な画像に遭遇したとき、所定のターゲットテキストを出力テキストに挿入する。画像内容のセマンティックな整合性を確保するために,新たなセマンティック保存損失を提案する。
論文参考訳（メタデータ） (2024-09-28T04:37:09Z)
Safeguarding Vision-Language Models Against Patched Visual Prompt Injectors [31.383591942592467]
視覚言語モデル(VLM)は、視覚とテキストのデータを組み合わせて理解と相互作用を強化する革新的な方法を提供する。パッチベースの敵攻撃は、物理的な視覚応用において最も現実的な脅威モデルと考えられている。本研究では,スムージング技術に根ざした防御機構であるSmoothVLMを導入し,VLMをパッチ付き視覚プロンプトインジェクタの脅威から保護する。
論文参考訳（メタデータ） (2024-05-17T04:19:19Z)
Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.50622628004134]
知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-21T18:28:43Z)
Instruct2Attack: Language-Guided Semantic Adversarial Attacks [76.83548867066561]
Instruct2Attack (I2A) は、自由形式の言語命令に従って意味のある摂動を生成する言語誘導セマンティックアタックである。我々は最先端の潜伏拡散モデルを用いて、逆拡散過程を逆ガイドし、入力画像とテキスト命令に条件付けされた逆潜伏符号を探索する。 I2Aは、強い敵の防御の下でも最先端のディープニューラルネットワークを破ることができることを示す。
論文参考訳（メタデータ） (2023-11-27T05:35:49Z)
Visual Adversarial Examples Jailbreak Aligned Large Language Models [66.53468356460365]
視覚入力の連続的かつ高次元的な性質は、敵対的攻撃に対する弱いリンクであることを示す。我々は、視力統合されたLLMの安全ガードレールを回避するために、視覚的敵の例を利用する。本研究は,マルチモダリティの追求に伴う敵のエスカレーションリスクを浮き彫りにする。
論文参考訳（メタデータ） (2023-06-22T22:13:03Z)
How Deep Learning Sees the World: A Survey on Adversarial Attacks & Defenses [0.0]
本稿では、攻撃能力によってグループ化された最新の敵攻撃と、防御戦略によってクラスタ化された現代の防御をコンパイルする。また、視覚変換器に関する新たな進歩を提示し、敵対的設定の文脈で使用されるデータセットとメトリクスを要約し、異なる攻撃下での最先端の結果を比較し、オープンな問題の特定で終了する。
論文参考訳（メタデータ） (2023-05-18T10:33:28Z)
Characterizing the adversarial vulnerability of speech self-supervised learning [95.03389072594243]
我々は,ゼロ知識とリミテッド知識の両方の敵からの攻撃の下で,そのようなパラダイムの敵対的脆弱性を調査するための最初の試みを行う。実験結果から, SUPERB が提案するパラダイムは, 限られた知識を持つ敵に対して脆弱であることが示唆された。
論文参考訳（メタデータ） (2021-11-08T08:44:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。