論文の概要: Translate your gibberish: black-box adversarial attack on machine
translation systems
- arxiv url: http://arxiv.org/abs/2303.10974v2
- Date: Tue, 23 May 2023 19:19:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 01:42:24.606310
- Title: Translate your gibberish: black-box adversarial attack on machine
translation systems
- Title(参考訳): gibberishを翻訳する: 機械翻訳システムに対するブラックボックスの逆襲
- Authors: Andrei Chertkov, Olga Tsymboi, Mikhail Pautov, Ivan Oseledets
- Abstract要約: 我々は、ロシア語から英語への翻訳作業において、最先端の機械翻訳ツールを騙すための簡単なアプローチを提示する。
Google、DeepL、Yandexなど多くのオンライン翻訳ツールが、非意味な逆入力クエリに対して間違ったあるいは攻撃的な翻訳を生成する可能性があることを示す。
この脆弱性は、新しい言語を理解することを妨げ、単に機械翻訳システムを使用する際のユーザエクスペリエンスを悪化させる可能性がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural networks are deployed widely in natural language processing tasks on
the industrial scale, and perhaps the most often they are used as compounds of
automatic machine translation systems. In this work, we present a simple
approach to fool state-of-the-art machine translation tools in the task of
translation from Russian to English and vice versa. Using a novel black-box
gradient-free tensor-based optimizer, we show that many online translation
tools, such as Google, DeepL, and Yandex, may both produce wrong or offensive
translations for nonsensical adversarial input queries and refuse to translate
seemingly benign input phrases. This vulnerability may interfere with
understanding a new language and simply worsen the user's experience while
using machine translation systems, and, hence, additional improvements of these
tools are required to establish better translation.
- Abstract(参考訳): ニューラルネットワークは、産業規模で自然言語処理タスクに広くデプロイされ、おそらく最も頻繁に自動機械翻訳システムの化合物として使用される。
本研究では,ロシア語から英語への翻訳作業において,最先端機械翻訳ツールを騙すための簡単なアプローチを提案する。
そこで,Google,DeepL,Yandexなどのオンライン翻訳ツールでは,新しいブラックボックス・グラデーションフリーなテンソル・ベース・オプティマイザを用いることで,非意味な入力クエリに対して誤ったあるいは攻撃的な翻訳を生成でき,不明瞭な入力フレーズの翻訳を拒否できることを示す。
この脆弱性は新しい言語を理解するのを妨げ、機械翻訳システムを使いながらユーザー体験を悪化させる可能性があるため、より優れた翻訳を確立するためにこれらのツールのさらなる改善が必要である。
関連論文リスト
- Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - Multilingual Unsupervised Neural Machine Translation with Denoising
Adapters [77.80790405710819]
単言語データのみを持つ言語を翻訳・翻訳する多言語無教師機械翻訳の問題点を考察する。
この問題に対して、モノリンガルデータを活用するための標準的な手順は、計算コストが高くチューニングが難しいバックトランスレーションである。
本稿では,事前学習したmBART-50上に,デノナイジング対象のアダプタ層であるデノナイジングアダプタを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-20T10:18:29Z) - Using Machine Translation to Localize Task Oriented NLG Output [5.770385426429663]
本稿では、英語の出力に機械翻訳を適用することにより、これを行う。
要求される品質バーは完璧に近く、文の範囲は極めて狭く、機械翻訳訓練データとは大きく異なることが多い。
既存のアイデアに基づいて新しいものを追加することで、必要な品質バーに到達することができます。
論文 参考訳(メタデータ) (2021-07-09T15:56:45Z) - SJTU-NICT's Supervised and Unsupervised Neural Machine Translation
Systems for the WMT20 News Translation Task [111.91077204077817]
我々は英語・中国語・英語・ポーランド語・ドイツ語・アッパー・ソルビアンという3つの言語対の4つの翻訳指導に参加した。
言語ペアの異なる条件に基づいて、我々は多様なニューラルネットワーク翻訳(NMT)技術の実験を行った。
私たちの提出書では、主要なシステムは英語、中国語、ポーランド語、英語、ドイツ語から上セルビア語への翻訳の道順で第一位を獲得しました。
論文 参考訳(メタデータ) (2020-10-11T00:40:05Z) - Robust Neural Machine Translation: Modeling Orthographic and
Interpunctual Variation [3.3194866396158]
そこで本研究では,10種類の逆例を生成するための簡易な生成ノイズモデルを提案する。
ノイズの多いデータでテストすると、敵の例を使って訓練されたシステムは、クリーンなデータを翻訳するのと同様に、ほぼ同等に機能することを示す。
論文 参考訳(メタデータ) (2020-09-11T14:12:54Z) - Learning to Detect Unacceptable Machine Translations for Downstream
Tasks [33.07594909221625]
機械翻訳を言語横断パイプラインに配置し、下流タスクを導入し、機械翻訳のタスク固有の受容性を定義する。
これにより、並列データを活用して、大規模なアクセプタビリティアノテーションを自動的に生成できます。
我々は、下流のタスクや翻訳モデルに対するフレームワークの有効性を示す実験を行う。
論文 参考訳(メタデータ) (2020-05-08T09:37:19Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z) - Testing Machine Translation via Referential Transparency [28.931196266344926]
本稿では,機械翻訳ソフトウェアの検証方法として,RTI(Referenceentially transparent inputs)を提案する。
私たちの実践的実装であるPurityは、このプロパティが翻訳によって壊れていることを検知します。
RTIを評価するために、Google TranslateとBing Microsoft Translatorを200のラベルのない文でテストするためにPurityを使用します。
論文 参考訳(メタデータ) (2020-04-22T01:37:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。