論文の概要: Defending Against Disinformation Attacks in Open-Domain Question
Answering
- arxiv url: http://arxiv.org/abs/2212.10002v3
- Date: Mon, 26 Feb 2024 20:52:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 01:01:41.393122
- Title: Defending Against Disinformation Attacks in Open-Domain Question
Answering
- Title(参考訳): オープンドメイン質問応答における偽情報攻撃の防止
- Authors: Orion Weller, Aleem Khan, Nathaniel Weir, Dawn Lawrie, Benjamin Van
Durme
- Abstract要約: 探索収集の敵の毒殺は 生産システムの精度を大幅に低下させます
そこで本研究では,クエリ拡張を用いて,元の質問に答えられるが有毒である可能性が低い多種多様なパスを探索する手法を提案する。
- 参考スコア(独自算出の注目度): 39.22018783998232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work in open-domain question answering (ODQA) has shown that
adversarial poisoning of the search collection can cause large drops in
accuracy for production systems. However, little to no work has proposed
methods to defend against these attacks. To do so, we rely on the intuition
that redundant information often exists in large corpora. To find it, we
introduce a method that uses query augmentation to search for a diverse set of
passages that could answer the original question but are less likely to have
been poisoned. We integrate these new passages into the model through the
design of a novel confidence method, comparing the predicted answer to its
appearance in the retrieved contexts (what we call Confidence from Answer
Redundancy, i.e. CAR). Together these methods allow for a simple but effective
way to defend against poisoning attacks that provides gains of nearly 20% exact
match across varying levels of data poisoning/knowledge conflicts.
- Abstract(参考訳): オープンドメイン質問応答 (ODQA) の最近の研究により, 探索コレクションの敵性中毒が生産システムの精度を大幅に低下させる可能性が示されている。
しかし、これらの攻撃を防御する方法は、ほとんど、あるいは全く提案されていない。
そのためには、冗長な情報がしばしば大きなコーパスに存在するという直感に依存する。
そこで本研究では,クエリ拡張を用いて,元の質問に答えるが毒殺される可能性が低い多種多様な文を検索する手法を提案する。
提案手法は,新たな信頼度法を設計してモデルに新たなパスを組み込んだもので,予測された回答を検索した文脈におけるその外観と比較する(CAR,Answer Redundancy から Confidence と呼ぶ)。
これらの方法では、さまざまなレベルのデータ中毒/知識の衝突に対して、20%近い正確な一致をもたらす、簡易で効果的な毒殺攻撃の防御が可能になる。
関連論文リスト
- Poisoning Retrieval Corpora by Injecting Adversarial Passages [79.14287273842878]
本稿では,悪意のあるユーザが少数の逆行を発生させるような,高密度検索システムに対する新たな攻撃を提案する。
これらの逆行路を大規模な検索コーパスに挿入すると、この攻撃はこれらのシステムを騙すのに非常に効果的であることを示す。
また、教師なしと教師なしの両方の最先端の高密度レトリバーをベンチマークし、比較する。
論文 参考訳(メタデータ) (2023-10-29T21:13:31Z) - Mitigating Backdoor Poisoning Attacks through the Lens of Spurious
Correlation [43.75579468533781]
バックドアは、特定のトリガーとターゲットラベルでトレーニングインスタンスを作成できる。
本論文は, バックドア毒殺事件は, 単純なテキスト特徴と分類ラベルとの間には明白な相関関係があることを示唆する。
実験により、悪意のあるトリガーはターゲットラベルと高い相関関係があることが判明した。
論文 参考訳(メタデータ) (2023-05-19T11:18:20Z) - TASA: Deceiving Question Answering Models by Twin Answer Sentences
Attack [93.50174324435321]
本稿では,質問応答(QA)モデルに対する敵対的攻撃手法であるTASA(Twin Answer Sentences Attack)を提案する。
TASAは、金の回答を維持しながら、流動的で文法的な逆境を生み出す。
論文 参考訳(メタデータ) (2022-10-27T07:16:30Z) - Towards A Conceptually Simple Defensive Approach for Few-shot
classifiers Against Adversarial Support Samples [107.38834819682315]
本研究は,数発の分類器を敵攻撃から守るための概念的簡便なアプローチについて検討する。
本稿では,自己相似性とフィルタリングの概念を用いた簡易な攻撃非依存検出法を提案する。
ミニイメージネット(MI)とCUBデータセットの攻撃検出性能は良好である。
論文 参考訳(メタデータ) (2021-10-24T05:46:03Z) - ADC: Adversarial attacks against object Detection that evade Context
consistency checks [55.8459119462263]
文脈整合性チェックさえも、適切に構築された敵の例に対して脆弱であることを示す。
このような防御を覆す実例を生成するための適応型フレームワークを提案する。
我々の結果は、コンテキストを堅牢にモデル化し、一貫性をチェックする方法はまだ未解決の問題であることを示している。
論文 参考訳(メタデータ) (2021-10-24T00:25:09Z) - TREATED:Towards Universal Defense against Textual Adversarial Attacks [28.454310179377302]
本稿では,様々な摂動レベルの攻撃に対して,仮定なしに防御できる汎用的対向検出手法であるTREATEDを提案する。
3つの競合するニューラルネットワークと2つの広く使われているデータセットの大規模な実験により、本手法はベースラインよりも優れた検出性能が得られることが示された。
論文 参考訳(メタデータ) (2021-09-13T03:31:20Z) - BAARD: Blocking Adversarial Examples by Testing for Applicability,
Reliability and Decidability [12.079529913120593]
敵防衛は、機械学習モデルを敵攻撃から保護するが、しばしばある種類のモデルや攻撃に適合する。
ケミノフォマティクスにおける応用可能性ドメインの概念から着想を得た。
本稿では,グローバルかつローカルにインプットをチェックする,シンプルで堅牢な3段階データ駆動フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-02T15:24:33Z) - Defensive Few-shot Learning [77.82113573388133]
本稿では,防御的数発学習という新たな課題について検討する。
敵の攻撃に対して頑丈な数発のモデルを学習することを目的としている。
提案したフレームワークは、既存の数発のモデルを敵攻撃に対して効果的に堅牢にすることができる。
論文 参考訳(メタデータ) (2019-11-16T05:57:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。