Fugu-MT 論文翻訳(概要): Are Multilingual BERT models robust? A Case Study on Adversarial Attacks for Multilingual Question Answering

論文の概要: Are Multilingual BERT models robust? A Case Study on Adversarial Attacks for Multilingual Question Answering

arxiv url: http://arxiv.org/abs/2104.07646v1
Date: Thu, 15 Apr 2021 17:55:09 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-16 16:27:39.868122
Title: Are Multilingual BERT models robust? A Case Study on Adversarial Attacks for Multilingual Question Answering
Title（参考訳）: 多言語BERTモデルは堅牢か? 多言語質問応答に対する敵意攻撃の事例研究
Authors: Sara Rosenthal, Mihaela Bornea, Avirup Sil
Abstract要約: 我々は,多言語BERTで事前学習した多言語QA(MLQA)システムを探索し,攻撃に成功した最初の人物である。 QAペアの他の言語に関係なく、モデルが英語と質問の言語に優先順位を付けることを示しています。
参考スコア（独自算出の注目度）: 6.361895967993969
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent approaches have exploited weaknesses in monolingual question answering (QA) models by adding adversarial statements to the passage. These attacks caused a reduction in state-of-the-art performance by almost 50%. In this paper, we are the first to explore and successfully attack a multilingual QA (MLQA) system pre-trained on multilingual BERT using several attack strategies for the adversarial statement reducing performance by as much as 85%. We show that the model gives priority to English and the language of the question regardless of the other languages in the QA pair. Further, we also show that adding our attack strategies during training helps alleviate the attacks.
Abstract（参考訳）: 近年, 単言語質問応答モデル(QA)の弱点を利用して, 文節に逆文を追加する手法が提案されている。これらの攻撃により、最先端の性能はほぼ50%低下した。本稿では,多言語BERT上で事前学習した多言語QA(MLQA)システムに対して,対数文に対する攻撃戦略を用いて,最大85%の性能低下を図った。 QAペア内の他の言語に関係なく、モデルが英語と質問の言語に優先順位を与えることを示す。さらに、トレーニング中に攻撃戦略を追加することで攻撃を軽減できることも示しています。

関連論文リスト

Wolf Hidden in Sheep's Conversations: Toward Harmless Data-Based Backdoor Attacks for Jailbreaking Large Language Models [69.11679786018206]
Supervised Fine-tuning (SFT) は、大きな言語モデルと人間の意図を協調させ、ラベル付きタスク固有データでトレーニングする。近年の研究では、悪意のある攻撃者が、有害な質問応答ペアにトリガーを埋め込むことで、これらのモデルにバックドアを注入できることが示されている。脱獄性LLMに対する新しいクリーンデータバックドアアタックを提案する。
論文参考訳（メタデータ） (2025-05-23T08:13:59Z)
The Tower of Babel Revisited: Multilingual Jailbreak Prompts on Closed-Source Large Language Models [3.221349323179165]
大規模言語モデル(LLM)は、様々な領域に広く適用されているが、敵の迅速なインジェクションに弱いままである。我々は、フロンティアプロプライエタリなソリューションを評価するために、多様な攻撃手法を活用する、第一種統合敵フレームワークを提案する。我々の評価は、英語と中国語のセキュリティ内容の6つのカテゴリにまたがっており、32種類のジェイルブレイク攻撃に対して38,400のレスポンスが生成される。
論文参考訳（メタデータ） (2025-05-18T07:51:19Z)
BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models [32.092175234635654]
本稿では,Large Language Models (LLMs) に対する新たなバックドア攻撃について述べる。まず,特定の下流タスクのトレーニングデータをトリガー言語に翻訳することで,ベースライン言語バックドアアタックを実装した。この課題に対処するために、これらのタスクの特定の疑問によらず、チャットLLM内のダウンストリームタスクをトリガーできる新しいタスク非依存の言語バックドアであるBadLingualを設計する。
論文参考訳（メタデータ） (2025-05-06T13:07:57Z)
Demystifying Multilingual Chain-of-Thought in Process Reward Modeling [71.12193680015622]
プロセス報酬モデル(PRM)を多言語設定に拡張するという課題に対処する。我々は、7つの言語にまたがるデータセット上で多言語PRMを訓練し、それを英語から翻訳する。本結果は,学習言語数と英語データ量の両方に対する多言語PRMの感度を強調した。
論文参考訳（メタデータ） (2025-02-18T09:11:44Z)
Deceiving Question-Answering Models: A Hybrid Word-Level Adversarial Approach [11.817276791266284]
本稿では,QAモデルを騙す新しい単語レベル対逆戦略であるQA-Attackを紹介する。我々のアテンションベースの攻撃は、特定の単語を識別・ターゲットするために、カスタマイズされたアテンション機構と削除ランキング戦略を利用する。同義語を慎重に選択し置換し、文法的整合性を保ちながら、間違った反応を生み出すためにモデルを誤解させる。
論文参考訳（メタデータ） (2024-11-12T23:54:58Z)
Revisiting Character-level Adversarial Attacks for Language Models [53.446619686108754]
本稿では、高い攻撃成功率(ASR)を達成することができる効率的なクエリベースの敵攻撃であるCharmerを紹介する。提案手法は,小型 (BERT) モデルと大型 (Llama 2) モデルの両方を対象としている。
論文参考訳（メタデータ） (2024-05-07T14:23:22Z)
TuBA: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning [63.481446315733145]
多言語大言語モデル(LLM)に対する言語間バックドア攻撃は未調査である。本研究は, 教育指導データが有毒でない言語に対して, 教育指導データの有毒化がアウトプットに与える影響について検討した。本手法は,mT5 や GPT-4o などのモデルにおいて,高い攻撃成功率を示し,12言語中7言語以上で90%以上を突破した。
論文参考訳（メタデータ） (2024-04-30T14:43:57Z)
Text Embedding Inversion Security for Multilingual Language Models [2.790855523145802]
研究は、基礎となるモデルに関する知識がなくても、埋め込みからテキストを再構築できることを示している。本研究は,単言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語
論文参考訳（メタデータ） (2024-01-22T18:34:42Z)
Cross-lingual QA: A Key to Unlocking In-context Cross-lingual Performance [2.371686365695081]
クロスランガルQAは、質問と回答の部分のみを翻訳し、翻訳コストを削減できる言語間プロンプト手法である。 4つのタイプ的多言語ベンチマークの実験により、クロスランガルQAはモデルに効果的に刺激を与え、クロスランガルの知識を引き出すことを示した。本研究は,言語間実例を用いたオープンソースMLLMの高速化により,モデルスケールの増大に伴い,性能が向上することを示す。
論文参考訳（メタデータ） (2023-05-24T15:14:49Z)
TASA: Deceiving Question Answering Models by Twin Answer Sentences Attack [93.50174324435321]
本稿では,質問応答(QA)モデルに対する敵対的攻撃手法であるTASA(Twin Answer Sentences Attack)を提案する。 TASAは、金の回答を維持しながら、流動的で文法的な逆境を生み出す。
論文参考訳（メタデータ） (2022-10-27T07:16:30Z)
Delving Deeper into Cross-lingual Visual Question Answering [115.16614806717341]
標準学習装置に簡単な修正を加えることで、モノリンガル英語のパフォーマンスへの移行ギャップを大幅に減らすことができることを示す。多言語マルチモーダル変換器の多言語間VQAを多言語間VQAで解析する。
論文参考訳（メタデータ） (2022-02-15T18:22:18Z)
Putting words into the system's mouth: A targeted attack on neural machine translation using monolingual data poisoning [50.67997309717586]
本稿では、悪意のある敵が、バックトランスレーションを用いて訓練されたシステムのトレーニングセットに、モノリンガルテキストの少量の有毒サンプルを挿入する中毒攻撃を提案する。このサンプルは、パドリング誤報のような特定の標的となる翻訳行動を引き起こすように設計されている。有毒な例を作るための2つの方法を示し、トレーニングセットの0.02%にしか満たない少数の事例しか、攻撃を成功させるには不十分であることを示した。
論文参考訳（メタデータ） (2021-07-12T08:07:09Z)
Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文参考訳（メタデータ） (2020-04-28T11:27:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。