Fugu-MT 論文翻訳(概要): Frauds Bargain Attack: Generating Adversarial Text Samples via Word Manipulation Process

論文の概要: Frauds Bargain Attack: Generating Adversarial Text Samples via Word Manipulation Process

arxiv url: http://arxiv.org/abs/2303.01234v1
Date: Wed, 1 Mar 2023 06:04:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-03 14:29:50.702055
Title: Frauds Bargain Attack: Generating Adversarial Text Samples via Word Manipulation Process
Title（参考訳）: frauds bargain attack: 単語操作プロセスによる逆テキストサンプルの生成
Authors: Mingze Ni, Zhensu Sun and Wei Liu
Abstract要約: 本研究はFraud's Bargain Attack (FBA)を提案する。新たなランダム化機構を用いて探索空間を拡大し、高い確率で高品質な逆例を生成する。大規模な実験により、FBAは攻撃成功率と非受容性の両方の観点から最先端の手法よりも優れていることが示された。
参考スコア（独自算出の注目度）: 5.903808254884862
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent studies on adversarial examples expose vulnerabilities of natural language processing (NLP) models. Existing techniques for generating adversarial examples are typically driven by deterministic heuristic rules that are agnostic to the optimal adversarial examples, a strategy that often results in attack failures. To this end, this research proposes Fraud's Bargain Attack (FBA) which utilizes a novel randomization mechanism to enlarge the search space and enables high-quality adversarial examples to be generated with high probabilities. FBA applies the Metropolis-Hasting sampler, a member of Markov Chain Monte Carlo samplers, to enhance the selection of adversarial examples from all candidates proposed by a customized stochastic process that we call the Word Manipulation Process (WMP). WMP perturbs one word at a time via insertion, removal or substitution in a contextual-aware manner. Extensive experiments demonstrate that FBA outperforms the state-of-the-art methods in terms of both attack success rate and imperceptibility.
Abstract（参考訳）: 近年,自然言語処理(NLP)モデルの脆弱性が報告されている。既存の敵の例を生成する技術は通常、最適な敵の例とは無関係な決定論的ヒューリスティックなルールによって駆動される。そこで本研究では,新たなランダム化機構を用いて検索空間を拡大し,高い確率で高品質な敵例を生成可能にする不正行為のバーゲン攻撃(fba)を提案する。 FBAは、Markov Chain Monte CarloサンプルラーのメンバーであるMetropolis-Hastingサンプルラーを適用し、私たちがWord Manipulation Process (WMP)と呼ぶカスタマイズされた確率過程によって提案される全ての候補からの敵例の選択を強化する。 WMPは、文脈に応じた方法で挿入、除去、置換を通じて、一度に1つの単語を摂動させる。大規模な実験により、FBAは攻撃成功率と非受容性の両方の観点から最先端の手法よりも優れていることが示された。

関連論文リスト

Uncertainty Quantification for LLMs through Minimum Bayes Risk: Bridging Confidence and Consistency [66.96286531087549]
大規模言語モデル(LLM)のための不確実性定量化(UQ)手法は、様々なアプローチを含んでいる。本稿では,モデル信頼度と出力整合性を統合する新しい手法を提案する。我々は,質問応答,抽象要約,機械翻訳など,様々なタスクに対するアプローチを評価する。
論文参考訳（メタデータ） (2025-02-07T14:30:12Z)
Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation [60.493180081319785]
本稿では,各復号工程における多様性とリスクのトレードオフを考慮し,トラクションサンプリング手法の本質的な能力を推定する体系的手法を提案する。本研究は,既存のトラクションサンプリング手法の総合的な比較と,ユーザのガイドラインとして推奨されるパラメータについて紹介する。
論文参考訳（メタデータ） (2024-08-24T14:14:32Z)
A Constraint-Enforcing Reward for Adversarial Attacks on Text Classifiers [10.063169009242682]
逆例を生成するために,エンコーダ-デコーダパラフレーズモデルを訓練する。我々は強化学習アルゴリズムを採用し、制約付き報酬を提案する。提案手法の主な設計選択が生成した例にどのように影響するかを示し,提案手法の長所と短所について議論する。
論文参考訳（メタデータ） (2024-05-20T09:33:43Z)
Reversible Jump Attack to Textual Classifiers with Modification Reduction [8.247761405798874]
Reversible Jump Attack (RJA) とMetropolis-Hasting Modification Reduction (MMR) が提案されている。 RJA-MMRは、攻撃性能、非受容性、流布性、文法の正しさにおいて、現在の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-21T04:54:31Z)
Token-Level Adversarial Prompt Detection Based on Perplexity Measures and Contextual Information [67.78183175605761]
大規模言語モデルは、敵の迅速な攻撃に影響を受けやすい。この脆弱性は、LLMの堅牢性と信頼性に関する重要な懸念を浮き彫りにしている。トークンレベルで敵のプロンプトを検出するための新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-20T03:17:21Z)
Context-aware Adversarial Attack on Named Entity Recognition [15.049160192547909]
本研究では,文脈対応型対向攻撃法について検討し,モデルのロバスト性について検討する。具体的には、エンティティを認識するために最も情報に富む単語を摂動し、敵の例を作成することを提案する。実験と分析により,本手法は強いベースラインよりも間違った予測を下すのに有効であることが示された。
論文参考訳（メタデータ） (2023-09-16T14:04:23Z)
In and Out-of-Domain Text Adversarial Robustness via Label Smoothing [64.66809713499576]
多様なNLPタスクの基本モデルにおいて,ラベルの平滑化戦略によって提供される対角的ロバスト性について検討する。実験の結果,ラベルのスムース化は,BERTなどの事前学習モデルにおいて,様々な攻撃に対して,逆方向の堅牢性を大幅に向上させることがわかった。また,予測信頼度とロバスト性の関係を解析し,ラベルの平滑化が敵の例に対する過度な信頼誤差を減少させることを示した。
論文参考訳（メタデータ） (2022-12-20T14:06:50Z)
ADDMU: Detection of Far-Boundary Adversarial Examples with Data and Model Uncertainty Estimation [125.52743832477404]
AED(Adversarial Examples Detection)は、敵攻撃に対する重要な防御技術である。本手法は, 正逆検出とFB逆検出の2種類の不確実性推定を組み合わせた新しい手法である textbfADDMU を提案する。提案手法は,各シナリオにおいて,従来の手法よりも3.6と6.0のEmphAUC点が優れていた。
論文参考訳（メタデータ） (2022-10-22T09:11:12Z)
Phrase-level Adversarial Example Generation for Neural Machine Translation [75.01476479100569]
本稿では,句レベルの逆例生成(PAEG)手法を提案し,モデルの堅牢性を高める。我々は,LDC中英語,IWSLT14ドイツ語-英語,WMT14英語-ドイツ語タスクの3つのベンチマークで検証を行った。
論文参考訳（メタデータ） (2022-01-06T11:00:49Z)
Randomized Substitution and Vote for Textual Adversarial Example Detection [6.664295299367366]
一連の研究により、自然なテキスト処理モデルが敵の例に弱いことが示されている。我々はランダム化代用投票法(RS&V)と呼ばれる新しいテキスト対逆例検出法を提案する。 3つのベンチマークデータセットに対する実証的な評価は、RS&Vが既存の検出方法よりも、テキストの逆例をよりうまく検出できることを示している。
論文参考訳（メタデータ） (2021-09-13T04:17:58Z)
Contextualized Perturbation for Textual Adversarial Attack [56.370304308573274]
逆例は自然言語処理(NLP)モデルの脆弱性を明らかにする。本稿では,フロートおよび文法的出力を生成するContextualized AdversaRial Example生成モデルであるCLAREを提案する。
論文参考訳（メタデータ） (2020-09-16T06:53:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。