Fugu-MT 論文翻訳(概要): SEP-Attack: A Simple and Effective Paradigm for Transfer-Based Textual Adversarial Attack

論文の概要: SEP-Attack: A Simple and Effective Paradigm for Transfer-Based Textual Adversarial Attack

arxiv url: http://arxiv.org/abs/2605.24958v1
Date: Sun, 24 May 2026 09:15:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:18.54488
Title: SEP-Attack: A Simple and Effective Paradigm for Transfer-Based Textual Adversarial Attack
Title（参考訳）: SEP-Attack:トランスファーベースのテキスト逆攻撃のためのシンプルで効果的なパラダイム
Authors: Han Liu, Zhi Xu, Xiaotong Zhang, Feng Zhang, Xiaoming Xu, Wei Wang, Fenglong Ma, Hong Yu,
Abstract要約: 転送可能な敵攻撃は、テキストドメインではまだ探索されていない。本稿では,SEP-Attack というトランスファーベースのテキスト逆攻撃のパラダイムを提案する。 4つのデータセットと2つの実世界のAPIで実施された実験は、SEP-Attackの有効性を検証する。
参考スコア（独自算出の注目度）: 34.576815318831684
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Despite the strong performance of deep neural networks in modern Web and language applications, they remain vulnerable to adversarial attacks, especially transferable attacks that generate adversarial examples using surrogate models without accessing the victim model. Transferable attacks in the text domain are still under-explored, with only a few studies addressing this challenging issue, often with suboptimal results due to equal treatment of submodels or inaccurate estimation of importance scores. To address these challenges, we propose a simple yet effective paradigm for transfer-based textual adversarial attack, named SEP-Attack. Specifically, we employ the Determinantal Point Process (DPP) to generate diverse surrogate ensemble weights, representing the transferability of submodels. Using these weights, we introduce a new metric to evaluate prediction confidence scores, which in turn are used to calculate word importance scores and generate adversarial candidates. Finally, we quantify the transferability score for each candidate and select the top ones as the final transferable adversarial examples. Experiments conducted on four datasets and two real-world APIs validate the efficacy of SEP-Attack, significantly outperforming state-of-the-art baselines.
Abstract（参考訳）: 現代のWebや言語アプリケーションにおけるディープニューラルネットワークの性能は高いが、敵攻撃、特に被害者モデルにアクセスせずに代理モデルを使用して敵の例を生成する転送可能な攻撃には弱いままである。テキスト領域でのトランスファー可能な攻撃はまだ未調査であり、この課題に対処する研究はごくわずかであり、しばしばサブモデルの平等な処理や重要度の不正確な推定による最適以下の結果を伴う。これらの課題に対処するため,SEP-Attack という名称のトランスファーベースのテキスト敵対攻撃のための,シンプルで効果的なパラダイムを提案する。具体的には,行列点法(Determinantal Point Process, DPP)を用いて, サブモデルの伝達可能性を表す多様なサロゲートアンサンブル重みを生成する。これらの重みを用いて、予測信頼度を評価するための新しい指標を導入し、単語の重要度を計算し、敵候補を生成する。最後に、各候補の転送可能性スコアを定量化し、上位候補を最終転送可能な逆数例として選択する。 4つのデータセットと2つの実世界のAPIで実施された実験は、SEP-Attackの有効性を検証する。

関連論文リスト

Efficient Generation of Targeted and Transferable Adversarial Examples for Vision-Language Models Via Diffusion Models [17.958154849014576]
大規模視覚言語モデル(VLM)のロバスト性を評価するために、敵対的攻撃を用いることができる。従来のトランスファーベースの敵攻撃は、高いイテレーション数と複雑なメソッド構造により、高いコストを発生させる。本稿では, 拡散モデルを用いて, 自然, 制約のない, 対象とする対向的な例を生成するAdvDiffVLMを提案する。
論文参考訳（メタデータ） (2024-04-16T07:19:52Z)
Semantic Stealth: Adversarial Text Attacks on NLP Using Several Methods [0.0]
テキスト敵攻撃は、入力テキストを意図的に操作することで、モデルの予測を誤解させる。本稿では,BERT,BERT-on-BERT,Fraud Bargain's Attack (FBA)について述べる。 PWWSは最も強力な敵として登場し、複数の評価シナリオで他のメソッドよりも一貫して優れています。
論文参考訳（メタデータ） (2024-04-08T02:55:01Z)
SA-Attack: Improving Adversarial Transferability of Vision-Language Pre-training Models via Self-Augmentation [56.622250514119294]
ホワイトボックスの敵攻撃とは対照的に、転送攻撃は現実世界のシナリオをより反映している。本稿では,SA-Attackと呼ばれる自己拡張型転送攻撃手法を提案する。
論文参考訳（メタデータ） (2023-12-08T09:08:50Z)
Avoid Adversarial Adaption in Federated Learning by Multi-Metric Investigations [55.2480439325792]
Federated Learning(FL)は、分散機械学習モデルのトレーニング、データのプライバシの保護、通信コストの低減、多様化したデータソースによるモデルパフォーマンスの向上を支援する。 FLは、中毒攻撃、標的外のパフォーマンス劣化とターゲットのバックドア攻撃の両方でモデルの整合性を損なうような脆弱性に直面している。我々は、複数の目的に同時に適応できる、強い適応的敵の概念を新たに定義する。 MESASは、実際のデータシナリオで有効であり、平均オーバーヘッドは24.37秒である。
論文参考訳（メタデータ） (2023-06-06T11:44:42Z)
In and Out-of-Domain Text Adversarial Robustness via Label Smoothing [64.66809713499576]
多様なNLPタスクの基本モデルにおいて,ラベルの平滑化戦略によって提供される対角的ロバスト性について検討する。実験の結果,ラベルのスムース化は,BERTなどの事前学習モデルにおいて,様々な攻撃に対して,逆方向の堅牢性を大幅に向上させることがわかった。また,予測信頼度とロバスト性の関係を解析し,ラベルの平滑化が敵の例に対する過度な信頼誤差を減少させることを示した。
論文参考訳（メタデータ） (2022-12-20T14:06:50Z)
Improving Adversarial Robustness to Sensitivity and Invariance Attacks with Deep Metric Learning [80.21709045433096]
対向ロバスト性の標準的な方法は、サンプルを最小に摂動させることによって作られたサンプルに対して防御する枠組みを仮定する。距離学習を用いて、最適輸送問題として逆正則化をフレーム化する。予備的な結果から, 変分摂動の規則化は, 変分防御と敏感防御の両方を改善することが示唆された。
論文参考訳（メタデータ） (2022-11-04T13:54:02Z)
Learning-based Hybrid Local Search for the Hard-label Textual Attack [53.92227690452377]
我々は,攻撃者が予測ラベルにのみアクセス可能な,滅多に調査されていないが厳格な設定,すなわちハードラベル攻撃を考える。そこで本研究では,Learning-based Hybrid Local Search (LHLS)アルゴリズムという,新たなハードラベル攻撃を提案する。我々のLHLSは、攻撃性能と敵の品質に関する既存のハードラベル攻撃を著しく上回っている。
論文参考訳（メタデータ） (2022-01-20T14:16:07Z)
TREND: Transferability based Robust ENsemble Design [6.663641564969944]
本稿では, ネットワークアーキテクチャ, 入力, 重量, アクティベーションの量子化が, 対向サンプルの転送性に及ぼす影響について検討する。本研究では,ソースとターゲット間の入力量子化によってトランスファービリティが著しく阻害されていることを示す。我々は、これに対抗するために、新しい最先端のアンサンブル攻撃を提案する。
論文参考訳（メタデータ） (2020-08-04T13:38:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。