論文の概要: Machine Translation and Post-Editing: Comparative Evaluation of Different MT Systems and Post-Editor Groups in Specialised Translation
- arxiv url: http://arxiv.org/abs/2606.23002v1
- Date: Mon, 22 Jun 2026 08:17:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 02:54:22.237597
- Title: Machine Translation and Post-Editing: Comparative Evaluation of Different MT Systems and Post-Editor Groups in Specialised Translation
- Title(参考訳): 機械翻訳と後編集:特殊翻訳における異なるMTシステムと編集後グループの比較評価
- Authors: Joachim Minder, Alexandra Mestivier, Natalie Kübler,
- Abstract要約: 本稿では、英語からフランス語への特殊翻訳の文脈において、機械翻訳(MT)と後編集(PE)の質を評価することを目的とする。
3つのMTシステム(DeepL、eTranslation、Systran)を比較した。
以上の結果から,3つのMTシステムと2つの後編グループ,特に用語的精度と流布率に有意な差が認められた。
- 参考スコア(独自算出の注目度): 41.99844472131922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article aims to evaluate the quality of machine translation (MT) and post-editing (PE) in the context of specialised translation from English into French. Three MT systems (DeepL, eTranslation and Systran) were compared, and two groups of post-editors -linguists/translators and NLP experts -were asked to perform post-editing. Translation assessment is based on error annotation using an error typology adapted to MT and PE evaluation. The results reveal significant differences between the three MT systems and the two groups of post-editors, particularly in terms of terminological accuracy and fluency. This study highlights the importance of domain knowledge in specialised translation, as well as the limitations and variable performance of MT systems in language for specific purposes (LSP).
- Abstract(参考訳): 本稿では、英語からフランス語への特殊翻訳の文脈において、機械翻訳(MT)と後編集(PE)の質を評価することを目的とする。
3つのMTシステム(DeepL、eTranslation、Systran)を比較した。
翻訳評価は,MTとPEに適応した誤り型を用いた誤りアノテーションに基づく。
以上の結果から,3つのMTシステムと2つの後編グループ,特に用語的精度と流布率に有意な差が認められた。
本研究では、特殊翻訳におけるドメイン知識の重要性と、特定の目的のための言語(LSP)におけるMTシステムの限界と変動性能を強調した。
関連論文リスト
- Beyond Literal Mapping: Benchmarking and Improving Non-Literal Translation Evaluation [57.11989521509119]
本稿では,特殊なサブエージェントを起動するリフレクティブコアエージェントを中心に,エージェント翻訳評価フレームワークを提案する。
実験の結果、RATEの有効性が示され、現在の測定値と比較して少なくとも3.2メタスコアの改善が達成された。
論文 参考訳(メタデータ) (2026-01-12T09:03:42Z) - Do GPTs Produce Less Literal Translations? [20.095646048167612]
大規模言語モデル(LLM)は多くの自然言語生成や理解タスクに対処できる汎用言語モデルとして登場した。
GPTからの英語(E-X)からの翻訳はリテラルが低い傾向にあり、機械翻訳の品質指標に類似またはより良いスコアが示されることがわかりました。
論文 参考訳(メタデータ) (2023-05-26T10:38:31Z) - Revisiting Machine Translation for Cross-lingual Classification [91.43729067874503]
この分野のほとんどの研究は、機械翻訳コンポーネントではなく多言語モデルに焦点を当てている。
より強力なMTシステムを用いて、原文のトレーニングと機械翻訳テキストの推論のミスマッチを緩和することにより、翻訳テストは以前想定していたよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-23T16:56:10Z) - Discourse Centric Evaluation of Machine Translation with a Densely
Annotated Parallel Corpus [82.07304301996562]
本稿では,江らが導入した大規模並列コーパスBWBに基づいて,リッチな談話アノテーションを用いた新しいデータセットを提案する。
ソース言語とターゲット言語の談話構造と類似点と相違点について検討する。
我々はMT出力が人間の翻訳と基本的に異なることを発見した。
論文 参考訳(メタデータ) (2023-05-18T17:36:41Z) - Extrinsic Evaluation of Machine Translation Metrics [78.75776477562087]
文レベルでの翻訳と翻訳の良さを区別する上で,自動尺度が信頼性が高いかどうかは不明である。
我々は,3つの下流言語タスクにおいて,最も広く使用されているMTメトリクス(chrF,COMET,BERTScoreなど)のセグメントレベル性能を評価する。
実験の結果,各指標は下流結果の外部評価と負の相関を示すことがわかった。
論文 参考訳(メタデータ) (2022-12-20T14:39:58Z) - DivEMT: Neural Machine Translation Post-Editing Effort Across
Typologically Diverse Languages [5.367993194110256]
DivEMTは、ニューラルネットワーク翻訳(NMT)に関する、タイプ的かつ多様なターゲット言語に対する初めての公開後研究である。
我々は、Google Translateとオープンソースの多言語モデルmBART50の2つの最先端NTTシステムの翻訳生産性への影響を評価する。
論文 参考訳(メタデータ) (2022-05-24T17:22:52Z) - What's the Difference Between Professional Human and Machine
Translation? A Blind Multi-language Study on Domain-specific MT [0.6091702876917281]
機械翻訳(MT)は、人間の後編集を必要とする多くのエラーを生成することが示されているが、プロの人間の翻訳(HT)がそのようなエラーを含む範囲はまだ比較されていない。
我々は、MTとHTがインターリーブされた事前翻訳文書をコンパイルし、プロの翻訳者にエラーを通知し、これらの文書をブラインド評価で後編集するよう依頼する。
MTセグメントの編集作業は3つの言語ペアのうち2つに過ぎず, 誤訳, 省略, タイポグラフィー上の問題もHTに類似していることが判明した。
論文 参考訳(メタデータ) (2020-06-08T17:55:14Z) - On the Limitations of Cross-lingual Encoders as Exposed by
Reference-Free Machine Translation Evaluation [55.02832094101173]
クロスランガルエンコーダの評価は通常、教師付き下流タスクにおけるゼロショットのクロスランガル転送または教師なしのクロスランガル類似性によって行われる。
本稿では、ソーステキストと(低品質な)システム翻訳を直接比較するMT(Reference-free Machine Translation)の評価について述べる。
事前学習したM-BERTとLASERで得られた最先端の言語間セマンティック表現に基づいて,様々なメトリクスを体系的に検討する。
参照なしMT評価において,セマンティックエンコーダとしての性能は低く,その2つの重要な限界を同定する。
論文 参考訳(メタデータ) (2020-05-03T22:10:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。