論文の概要: Machine Translation of Novels in the Age of Transformer
- arxiv url: http://arxiv.org/abs/2011.14979v1
- Date: Mon, 30 Nov 2020 16:51:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 14:52:09.057857
- Title: Machine Translation of Novels in the Age of Transformer
- Title(参考訳): 変圧器時代の小説の機械翻訳
- Authors: Antonio Toral, Antoni Oliver, Pau Ribas Ballest\'in
- Abstract要約: 本研究では,ニューラルMT (NMT) の最先端アーキテクチャをベースとした,英語からカタルーニャ語への翻訳方向の機械翻訳システムを構築した。
本稿では,このMTシステムと他の3つのシステム(リカレントおよびフレーズベースパラダイムに基づく2つのドメイン固有システムと一般的なオンラインシステム)を比較した。
予想通り、ドメイン固有のトランスフォーマーベースのシステムは、すべての3つの評価において、全ての場合において、大きなマージンで、他の3つのシステムよりも優れていた。
- 参考スコア(独自算出の注目度): 1.6453685972661827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this chapter we build a machine translation (MT) system tailored to the
literary domain, specifically to novels, based on the state-of-the-art
architecture in neural MT (NMT), the Transformer (Vaswani et al., 2017), for
the translation direction English-to-Catalan. Subsequently, we assess to what
extent such a system can be useful by evaluating its translations, by comparing
this MT system against three other systems (two domain-specific systems under
the recurrent and phrase-based paradigms and a popular generic on-line system)
on three evaluations. The first evaluation is automatic and uses the
most-widely used automatic evaluation metric, BLEU. The two remaining
evaluations are manual and they assess, respectively, preference and amount of
post-editing required to make the translation error-free. As expected, the
domain-specific Transformer-based system outperformed the three other systems
in all the three evaluations conducted, in all cases by a large margin.
- Abstract(参考訳): 本章では,ニューラルMT(NMT)やトランスフォーマー(Vaswani et al., 2017)の最先端アーキテクチャに基づいて,文学領域,特に小説に合わせた機械翻訳(MT)システムを構築している。
その後,本システムと他の3つのシステム(リカレント・フレーズ・ベース・パラダイム下の2つのドメイン特化システムと一般的なオンライン・システム)を3つの評価で比較し,翻訳の評価により,システムの有用性を評価する。
最初の評価は自動であり、最も広く使われている自動評価指標BLEUを使用する。
残る2つの評価は手動で行われ、それぞれ、翻訳エラーをなくすのに必要な編集後の好みと量を評価する。
予想通り、ドメイン固有のトランスフォーマーベースのシステムは、すべてのケースにおいて3つの評価すべてにおいて、他の3つのシステムよりも大きな利益を上げた。
関連論文リスト
- Evaluating Automatic Metrics with Incremental Machine Translation Systems [55.78547133890403]
商業機械翻訳からなるデータセットを導入し,12の翻訳方向から6年間にわたって収集した。
商業システムは時間とともに改善され、より最近の翻訳の好みに基づいて機械翻訳(MT)メトリクスを評価することができると仮定する。
論文 参考訳(メタデータ) (2024-07-03T17:04:17Z) - Good, but not always Fair: An Evaluation of Gender Bias for three commercial Machine Translation Systems [4.802214389376064]
本稿では、Google Translate、DeepL、Modern MTの3つの商用機械翻訳システムについて綿密に評価する。
3つの言語ペア(英語/スペイン語、英語/イタリア語、英語/フランス語)に対して、このようなシステムの振る舞いを、いくつかのレベルの粒度と、翻訳において自然に生じる様々なジェンダー現象について精査する。
本研究は, オンラインMTツールの現状を把握し, 3つのシステムの性別翻訳における大きな相違点を明らかにし, 全体的な翻訳品質に関わらず, それぞれのシステムが様々なバイアスを呈示することを示した。
論文 参考訳(メタデータ) (2023-06-09T13:24:27Z) - Supervised Visual Attention for Simultaneous Multimodal Machine
Translation [47.18251159303909]
本稿では,トランスフォーマーを用いた最初の同時機械翻訳(MMT)アーキテクチャを提案する。
我々は、ラベル付きフレーズ領域アライメントを用いて視覚的注意機構を誘導する補助的な監視信号を用いて、このモデルを拡張する。
その結果,教師付き視覚的注意はMTモデルの翻訳品質を常に向上させることがわかった。
論文 参考訳(メタデータ) (2022-01-23T17:25:57Z) - Multilingual Machine Translation Systems from Microsoft for WMT21 Shared
Task [95.06453182273027]
本報告では、大規模多言語機械翻訳におけるWMT21共有タスクのためのMicrosoftの機械翻訳システムについて述べる。
共有タスクへのモデル提出はDeltaLMnotefooturlhttps://aka.ms/deltalmで行われました。
最終提出は自動評価基準で3トラックにランクインした。
論文 参考訳(メタデータ) (2021-11-03T09:16:17Z) - It is Not as Good as You Think! Evaluating Simultaneous Machine
Translation on Interpretation Data [58.105938143865906]
我々は、実解釈データに基づいて、SiMTシステムをトレーニングし、テストすべきであると主張している。
以上の結果から,SiMTモデルが翻訳データと解釈データで評価された場合,最大13.83BLEUスコアの違いが明らかになった。
論文 参考訳(メタデータ) (2021-10-11T12:27:07Z) - Online Learning Meets Machine Translation Evaluation: Finding the Best
Systems with the Least Human Effort [0.0]
機械翻訳では、大量の自動翻訳の品質を評価することは困難である。
本稿では,機械翻訳システムのアンサンブルを前提として,最適システムに動的に収束するオンライン学習の新たな応用を提案する。
WMT'19データセットに対する我々の実験は、オンラインアプローチが、考慮された言語ペアの上位3位システムに迅速に収束していることを示している。
論文 参考訳(メタデータ) (2021-05-27T18:19:39Z) - The Impact of Indirect Machine Translation on Sentiment Classification [6.719549885077474]
本稿では,顧客からのフィードバックを他の言語に翻訳する機械翻訳システムを提案する。
直接翻訳が必ずしも可能であるとは限らないため、翻訳された文に対する自動分類器の性能について検討する。
提案する感情分類システムの性能を解析し、翻訳文の分類の利点と欠点について考察する。
論文 参考訳(メタデータ) (2020-08-25T20:30:21Z) - Fine-grained Human Evaluation of Transformer and Recurrent Approaches to
Neural Machine Translation for English-to-Chinese [3.3453601632404073]
我々は,Multidimensional Quality Metrics (MQM) フレームワークに準拠した誤り分類法を開発した。
次に、このカスタマイズされたエラー分類法を用いて、最先端のリカレントおよびトランスフォーマーベースのMTシステムの出力に対してエラーアノテーションを実行する。
得られたアノテーションは、最高の再帰システムと比較して、最適なトランスフォーマーシステムはエラーの総数を31%削減することを示している。
論文 参考訳(メタデータ) (2020-06-15T11:47:00Z) - Tangled up in BLEU: Reevaluating the Evaluation of Automatic Machine
Translation Evaluation Metrics [64.88815792555451]
評価法は, 評価に用いる翻訳に非常に敏感であることを示す。
本研究では,人的判断に対する自動評価基準の下で,性能改善をしきい値にする方法を開発した。
論文 参考訳(メタデータ) (2020-06-11T09:12:53Z) - On the Limitations of Cross-lingual Encoders as Exposed by
Reference-Free Machine Translation Evaluation [55.02832094101173]
クロスランガルエンコーダの評価は通常、教師付き下流タスクにおけるゼロショットのクロスランガル転送または教師なしのクロスランガル類似性によって行われる。
本稿では、ソーステキストと(低品質な)システム翻訳を直接比較するMT(Reference-free Machine Translation)の評価について述べる。
事前学習したM-BERTとLASERで得られた最先端の言語間セマンティック表現に基づいて,様々なメトリクスを体系的に検討する。
参照なしMT評価において,セマンティックエンコーダとしての性能は低く,その2つの重要な限界を同定する。
論文 参考訳(メタデータ) (2020-05-03T22:10:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。