論文の概要: It's not a Non-Issue: Negation as a Source of Error in Machine
Translation
- arxiv url: http://arxiv.org/abs/2010.05432v1
- Date: Mon, 12 Oct 2020 03:34:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 05:38:40.497112
- Title: It's not a Non-Issue: Negation as a Source of Error in Machine
Translation
- Title(参考訳): 非Issueではない:機械翻訳におけるエラーの原因としての否定
- Authors: Md Mosharaf Hossain, Antonios Anastasopoulos, Eduardo Blanco, and
Alexis Palmer
- Abstract要約: 本稿では,17の翻訳方向をテストベッドとして用いた機械翻訳システムにおいて,翻訳否定が問題となるかを検討する。
実際、否定の存在は下流の品質に大きく影響し、場合によっては60%以上の品質低下をもたらします。
- 参考スコア(独自算出の注目度): 33.991817055535854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As machine translation (MT) systems progress at a rapid pace, questions of
their adequacy linger. In this study we focus on negation, a universal, core
property of human language that significantly affects the semantics of an
utterance. We investigate whether translating negation is an issue for modern
MT systems using 17 translation directions as test bed. Through thorough
analysis, we find that indeed the presence of negation can significantly impact
downstream quality, in some cases resulting in quality reductions of more than
60%. We also provide a linguistically motivated analysis that directly explains
the majority of our findings. We release our annotations and code to replicate
our analysis here: https://github.com/mosharafhossain/negation-mt.
- Abstract(参考訳): 機械翻訳(MT)システムが急速に進歩するにつれて、その正確性に関する疑問が持ち上がる。
本研究では,発話の意味論に大きな影響を及ぼす,人間言語の普遍的コア特性である否定に注目した。
現代のmtシステムでは17の翻訳方向をテストベッドとして用いる場合,翻訳否定が問題となるか検討する。
徹底的な分析を通じて,否定の存在が下流品質に著しく影響を与え,品質が60%以上低下するケースも見られた。
また, 言語学的に動機づけた分析を行い, 結果の大部分を直接的に説明する。
分析を再現するために、アノテーションとコードをここでリリースします。
関連論文リスト
- Evaluating Automatic Metrics with Incremental Machine Translation Systems [55.78547133890403]
商業機械翻訳からなるデータセットを導入し,12の翻訳方向から6年間にわたって収集した。
商業システムは時間とともに改善され、より最近の翻訳の好みに基づいて機械翻訳(MT)メトリクスを評価することができると仮定する。
論文 参考訳(メタデータ) (2024-07-03T17:04:17Z) - Understanding and Addressing the Under-Translation Problem from the Perspective of Decoding Objective [72.83966378613238]
最新のニューラル・マシン・トランスレーション(NMT)システムでは、アンダー・トランスレーションとオーバー・トランスレーションの2つの課題が残っている。
我々は,NMTにおけるアンダートランスレーションの根本原因を詳細に分析し,デコード目的の観点から解説する。
本研究は,低翻訳の検知器としてEOS(End Of Sentence)予測の信頼性を活用し,低翻訳のリスクが高い候補を罰する信頼性に基づくペナルティを強化することを提案する。
論文 参考訳(メタデータ) (2024-05-29T09:25:49Z) - Mitigating Hallucinations and Off-target Machine Translation with
Source-Contrastive and Language-Contrastive Decoding [53.84948040596055]
修正された復号化目標を用いて、障害ケースを緩和する2つの関連手法を提案する。
大規模多言語モデルM2M-100 (418M) とSMaLL-100の実験は、これらの手法が幻覚やターゲット外の翻訳を抑制することを示した。
論文 参考訳(メタデータ) (2023-09-13T17:15:27Z) - Evaluation of Chinese-English Machine Translation of Emotion-Loaded
Microblog Texts: A Human Annotated Dataset for the Quality Assessment of
Emotion Translation [7.858458986992082]
本稿では,感情を重畳したテキストの翻訳において,現在の機械翻訳(MT)ツールがどのように機能するかに焦点を当てる。
本稿では,Multidimensional Quality Metrics(MQM)に基づく評価フレームワークを提案し,MT出力の詳細な誤差解析を行う。
論文 参考訳(メタデータ) (2023-06-20T21:22:45Z) - Do GPTs Produce Less Literal Translations? [20.095646048167612]
大規模言語モデル(LLM)は多くの自然言語生成や理解タスクに対処できる汎用言語モデルとして登場した。
GPTからの英語(E-X)からの翻訳はリテラルが低い傾向にあり、機械翻訳の品質指標に類似またはより良いスコアが示されることがわかりました。
論文 参考訳(メタデータ) (2023-05-26T10:38:31Z) - Competency-Aware Neural Machine Translation: Can Machine Translation
Know its Own Translation Quality? [61.866103154161884]
ニューラルマシン翻訳(NMT)は、意識せずに起こる失敗に対してしばしば批判される。
本稿では,従来のNMTを自己推定器で拡張することで,新たな能力認識型NMTを提案する。
提案手法は品質評価において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-11-25T02:39:41Z) - Automatic Evaluation and Analysis of Idioms in Neural Machine
Translation [12.227312923011986]
人間の関与なしにリテラル翻訳誤りの頻度を測定するための新しい指標を提案する。
モノリンガル事前学習の役割を探求し、それが実質的な改善をもたらすことを発見した。
ランダムなイディオムモデルは、文脈の変化の影響を受けないため、より局所的あるいは「ミオピック」であることが判明した。
論文 参考訳(メタデータ) (2022-10-10T10:30:09Z) - Revisiting Negation in Neural Machine Translation [26.694559863395877]
ニューラルネットワーク翻訳(NMT)モデルによる否定の翻訳能力は,より深く,より高度なネットワークによって向上したことを示す。
英語-ドイツ語 (EN--DE) と英語-中国語 (EN--ZH) のマニュアル評価の精度は95.7%、94.8%、93.4%、91.7%である。
論文 参考訳(メタデータ) (2021-07-26T13:19:57Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z) - On the Integration of LinguisticFeatures into Statistical and Neural
Machine Translation [2.132096006921048]
機械翻訳に対する統計的アプローチの強みと人間の翻訳方法の相違について検討する。
自動翻訳システムがより正確な翻訳を行うために欠落している言語情報を同定する。
我々は、過一般化または「アルゴミックバイアス」をニューラルMTの潜在的な欠点として認識し、残りの言語問題の多くにリンクする。
論文 参考訳(メタデータ) (2020-03-31T16:03:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。