論文の概要: Generating Adversarial Examples in Chinese Texts Using Sentence-Pieces
- arxiv url: http://arxiv.org/abs/2012.14769v1
- Date: Tue, 29 Dec 2020 14:28:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 20:38:20.686140
- Title: Generating Adversarial Examples in Chinese Texts Using Sentence-Pieces
- Title(参考訳): 文節を用いた中国語テキストの逆例生成
- Authors: Linyang Li, Yunfan Shao, Demin Song, Xipeng Qiu, Xuanjing Huang
- Abstract要約: 文片を用いた代用ジェネレータとして,中国語の逆例を作成できる事前学習型言語モデルを提案する。
生成した敵の例の置換は文字や単語ではなく「テキスト」であり、中国の読者にとって自然である。
- 参考スコア(独自算出の注目度): 60.58900627906269
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adversarial attacks in texts are mostly substitution-based methods that
replace words or characters in the original texts to achieve success attacks.
Recent methods use pre-trained language models as the substitutes generator.
While in Chinese, such methods are not applicable since words in Chinese
require segmentations first. In this paper, we propose a pre-train language
model as the substitutes generator using sentence-pieces to craft adversarial
examples in Chinese. The substitutions in the generated adversarial examples
are not characters or words but \textit{'pieces'}, which are more natural to
Chinese readers. Experiments results show that the generated adversarial
samples can mislead strong target models and remain fluent and semantically
preserved.
- Abstract(参考訳): テキストにおける敵対的攻撃は、多くの場合、成功した攻撃を達成するために、元のテキストにおける単語や文字を置き換える置換ベースの方法である。
最近の手法では、代用生成器として事前学習された言語モデルを使用している。
中国語ではそのような方法は適用できないが、中国語の単語はまず区切りを必要とする。
本稿では,中国語で副詞を作るために,文節を用いた代用詞生成器として事前学習言語モデルを提案する。
生成した対数例の置換は文字や単語ではなく、中国の読者にとって自然な「textit{'pieces'}」である。
実験の結果, 生成した逆行性サンプルは, 強いターゲットモデルに誤解を与え, 流動的かつ意味的に保存できることがわかった。
関連論文リスト
- Click: Controllable Text Generation with Sequence Likelihood Contrastive
Learning [69.35360098882606]
制御可能なテキスト生成のためのClickを導入し、モデルアーキテクチャを変更する必要はない。
シークエンス確率は対照的な損失を伴い、負のサンプルの生成確率を根本的に低下させる。
また、モデル世代から対照的なサンプルを構築するための、新しいランキングベースの戦略も採用している。
論文 参考訳(メタデータ) (2023-06-06T01:56:44Z) - On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。
改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。
我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文 参考訳(メタデータ) (2021-10-15T21:41:16Z) - Text Detoxification using Large Pre-trained Neural Models [57.72086777177844]
テキスト中の毒性を除去する2つの新しい教師なし手法を提案する。
最初の方法は、生成プロセスのガイダンスと、小さなスタイル条件言語モデルを組み合わせることである。
第2の方法は、BERTを使用して有害な単語を非攻撃的同義語に置き換える。
論文 参考訳(メタデータ) (2021-09-18T11:55:32Z) - From Solving a Problem Boldly to Cutting the Gordian Knot: Idiomatic
Text Generation [14.360808219541752]
テキスト生成のための新しいアプリケーション、慣用文生成について研究する。
与えられたリテラル文に対して適切なイディオムを求める,このタスクに対する新しいアプローチを提案する。
得られたイディオムと残りの文を組み合わせるために,ニューラルモデルを用いて慣用文を生成する。
論文 参考訳(メタデータ) (2021-04-13T22:57:25Z) - AdvExpander: Generating Natural Language Adversarial Examples by
Expanding Text [39.09728700494304]
AdvExpanderは、テキストを拡大することで、新しい敵対例を作成する方法を紹介します。
まず、言語規則を用いて、どの構成要素を拡張すべきかを決定する。
次にCVAEに基づく生成モデルから検索した逆修飾子を挿入して各成分を拡大する。
論文 参考訳(メタデータ) (2020-12-18T13:50:17Z) - Contextualized Perturbation for Textual Adversarial Attack [56.370304308573274]
逆例は自然言語処理(NLP)モデルの脆弱性を明らかにする。
本稿では,フロートおよび文法的出力を生成するContextualized AdversaRial Example生成モデルであるCLAREを提案する。
論文 参考訳(メタデータ) (2020-09-16T06:53:15Z) - Don't Change Me! User-Controllable Selective Paraphrase Generation [45.0436584774495]
パラフレーズ生成では、ソース文は変更すべきでないフレーズを含むことが多い。
私たちのソリューションは、任意のテキストセグメントに配置できる明示的なタグをユーザに提供することです。
この研究の貢献は、遠隔監視を用いた新しいデータ生成技術である。
論文 参考訳(メタデータ) (2020-08-21T03:31:50Z) - 2kenize: Tying Subword Sequences for Chinese Script Conversion [54.33749520569979]
本稿では,2つのスクリプト間のマッピングと変換をあいまいにできるモデルを提案する。
提案手法は,従来の漢字変換手法よりも精度が6ポイント向上した。
論文 参考訳(メタデータ) (2020-05-07T10:53:05Z) - BAE: BERT-based Adversarial Examples for Text Classification [9.188318506016898]
我々は,BERTマスマスキング言語モデルからコンテキスト摂動を用いて,敵の例を生成するブラックボックス攻撃であるBAEを提案する。
BAEは, 文法性やセマンティック・コヒーレンスを向上した逆例を生成することに加えて, より強力な攻撃を行うことを示す。
論文 参考訳(メタデータ) (2020-04-04T16:25:48Z) - Generating Natural Language Adversarial Examples on a Large Scale with
Generative Models [41.85006993382117]
生成モデルを用いて,テキストをスクラッチから効率的に生成するエンド・ツー・エンド・ソリューションを提案する。
具体的には,条件付き変分オートエンコーダを訓練し,さらに逆転損失を加えて,逆転例の生成を誘導する。
敵対的テキストの妥当性を向上させるために,識別器と生成的敵対的ネットワークの訓練枠組みを利用する。
論文 参考訳(メタデータ) (2020-03-10T03:21:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。