論文の概要: It's not a Non-Issue: Negation as a Source of Error in Machine
Translation
- arxiv url: http://arxiv.org/abs/2010.05432v1
- Date: Mon, 12 Oct 2020 03:34:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 05:38:40.497112
- Title: It's not a Non-Issue: Negation as a Source of Error in Machine
Translation
- Title(参考訳): 非Issueではない:機械翻訳におけるエラーの原因としての否定
- Authors: Md Mosharaf Hossain, Antonios Anastasopoulos, Eduardo Blanco, and
Alexis Palmer
- Abstract要約: 本稿では,17の翻訳方向をテストベッドとして用いた機械翻訳システムにおいて,翻訳否定が問題となるかを検討する。
実際、否定の存在は下流の品質に大きく影響し、場合によっては60%以上の品質低下をもたらします。
- 参考スコア(独自算出の注目度): 33.991817055535854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As machine translation (MT) systems progress at a rapid pace, questions of
their adequacy linger. In this study we focus on negation, a universal, core
property of human language that significantly affects the semantics of an
utterance. We investigate whether translating negation is an issue for modern
MT systems using 17 translation directions as test bed. Through thorough
analysis, we find that indeed the presence of negation can significantly impact
downstream quality, in some cases resulting in quality reductions of more than
60%. We also provide a linguistically motivated analysis that directly explains
the majority of our findings. We release our annotations and code to replicate
our analysis here: https://github.com/mosharafhossain/negation-mt.
- Abstract(参考訳): 機械翻訳(MT)システムが急速に進歩するにつれて、その正確性に関する疑問が持ち上がる。
本研究では,発話の意味論に大きな影響を及ぼす,人間言語の普遍的コア特性である否定に注目した。
現代のmtシステムでは17の翻訳方向をテストベッドとして用いる場合,翻訳否定が問題となるか検討する。
徹底的な分析を通じて,否定の存在が下流品質に著しく影響を与え,品質が60%以上低下するケースも見られた。
また, 言語学的に動機づけた分析を行い, 結果の大部分を直接的に説明する。
分析を再現するために、アノテーションとコードをここでリリースします。
関連論文リスト
- Mitigating Hallucinations and Off-target Machine Translation with
Source-Contrastive and Language-Contrastive Decoding [53.84948040596055]
修正された復号化目標を用いて、障害ケースを緩和する2つの関連手法を提案する。
大規模多言語モデルM2M-100 (418M) とSMaLL-100の実験は、これらの手法が幻覚やターゲット外の翻訳を抑制することを示した。
論文 参考訳(メタデータ) (2023-09-13T17:15:27Z) - Evaluation of Chinese-English Machine Translation of Emotion-Loaded
Microblog Texts: A Human Annotated Dataset for the Quality Assessment of
Emotion Translation [7.858458986992082]
本稿では,感情を重畳したテキストの翻訳において,現在の機械翻訳(MT)ツールがどのように機能するかに焦点を当てる。
本稿では,Multidimensional Quality Metrics(MQM)に基づく評価フレームワークを提案し,MT出力の詳細な誤差解析を行う。
論文 参考訳(メタデータ) (2023-06-20T21:22:45Z) - Do GPTs Produce Less Literal Translations? [20.095646048167612]
大規模言語モデル(LLM)は多くの自然言語生成や理解タスクに対処できる汎用言語モデルとして登場した。
GPTからの英語(E-X)からの翻訳はリテラルが低い傾向にあり、機械翻訳の品質指標に類似またはより良いスコアが示されることがわかりました。
論文 参考訳(メタデータ) (2023-05-26T10:38:31Z) - Competency-Aware Neural Machine Translation: Can Machine Translation
Know its Own Translation Quality? [61.866103154161884]
ニューラルマシン翻訳(NMT)は、意識せずに起こる失敗に対してしばしば批判される。
本稿では,従来のNMTを自己推定器で拡張することで,新たな能力認識型NMTを提案する。
提案手法は品質評価において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-11-25T02:39:41Z) - Automatic Evaluation and Analysis of Idioms in Neural Machine
Translation [12.227312923011986]
人間の関与なしにリテラル翻訳誤りの頻度を測定するための新しい指標を提案する。
モノリンガル事前学習の役割を探求し、それが実質的な改善をもたらすことを発見した。
ランダムなイディオムモデルは、文脈の変化の影響を受けないため、より局所的あるいは「ミオピック」であることが判明した。
論文 参考訳(メタデータ) (2022-10-10T10:30:09Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Revisiting Negation in Neural Machine Translation [26.694559863395877]
ニューラルネットワーク翻訳(NMT)モデルによる否定の翻訳能力は,より深く,より高度なネットワークによって向上したことを示す。
英語-ドイツ語 (EN--DE) と英語-中国語 (EN--ZH) のマニュアル評価の精度は95.7%、94.8%、93.4%、91.7%である。
論文 参考訳(メタデータ) (2021-07-26T13:19:57Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z) - On the Integration of LinguisticFeatures into Statistical and Neural
Machine Translation [2.132096006921048]
機械翻訳に対する統計的アプローチの強みと人間の翻訳方法の相違について検討する。
自動翻訳システムがより正確な翻訳を行うために欠落している言語情報を同定する。
我々は、過一般化または「アルゴミックバイアス」をニューラルMTの潜在的な欠点として認識し、残りの言語問題の多くにリンクする。
論文 参考訳(メタデータ) (2020-03-31T16:03:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。