論文の概要: Evaluating Optimal Reference Translations
- arxiv url: http://arxiv.org/abs/2311.16787v2
- Date: Fri, 8 Mar 2024 12:21:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 22:51:54.723171
- Title: Evaluating Optimal Reference Translations
- Title(参考訳): 最適参照翻訳の評価
- Authors: Vil\'em Zouhar, V\v{e}ra Kloudov\'a, Martin Popel, Ond\v{r}ej Bojar
- Abstract要約: 本稿では,より信頼性の高い文書レベルの人文参照翻訳手法を提案する。
得られた文書レベルの最適参照翻訳を「標準」翻訳と比較して評価した。
- 参考スコア(独自算出の注目度): 4.956416618428049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The overall translation quality reached by current machine translation (MT)
systems for high-resourced language pairs is remarkably good. Standard methods
of evaluation are not suitable nor intended to uncover the many translation
errors and quality deficiencies that still persist. Furthermore, the quality of
standard reference translations is commonly questioned and comparable quality
levels have been reached by MT alone in several language pairs. Navigating
further research in these high-resource settings is thus difficult. In this
article, we propose a methodology for creating more reliable document-level
human reference translations, called "optimal reference translations," with the
simple aim to raise the bar of what should be deemed "human translation
quality." We evaluate the obtained document-level optimal reference
translations in comparison with "standard" ones, confirming a significant
quality increase and also documenting the relationship between evaluation and
translation editing.
- Abstract(参考訳): 現在の機械翻訳(mt)システムによる高リソース言語ペアの全体的な翻訳品質は極めて良好である。
標準的な評価法は不適当であり、また、継続する多くの翻訳エラーや品質欠陥を明らかにする意図もない。
さらに、標準参照翻訳の品質は一般的に疑問視され、いくつかの言語対においてMTだけで同等の品質レベルに達している。
そのため、これらの高リソース環境でのさらなる研究は困難である。
本稿では,より信頼性の高い文書レベルのヒューマン・リファレンス・トランスレーション("optimal reference translations"と呼ばれる)を作成するための手法を提案する。
得られた文書レベルの最適参照翻訳を「標準」翻訳と比較して評価し、大幅な品質向上を確認し、評価と翻訳編集の関係を文書化する。
関連論文リスト
- Can Automatic Metrics Assess High-Quality Translations? [28.407966066693334]
現在のメトリクスは、翻訳品質の微妙な違いに敏感であることを示す。
この効果は、品質が高く、代替品間のばらつきが低い場合に最も顕著である。
MQMフレームワークを金の標準として使用することにより、現在のメトリクスが人間によってマークされた誤りのない翻訳を識別する能力を体系的にストレステストする。
論文 参考訳(メタデータ) (2024-05-28T16:44:02Z) - Advancing Translation Preference Modeling with RLHF: A Step Towards
Cost-Effective Solution [57.42593422091653]
人間のフィードバックによる強化学習の活用による翻訳品質の向上について検討する。
強力な言語能力を持つ報酬モデルは、翻訳品質の微妙な違いをより敏感に学習することができる。
論文 参考訳(メタデータ) (2024-02-18T09:51:49Z) - Quality and Quantity of Machine Translation References for Automatic Metrics [4.824118883700288]
高品質な参照は、セグメントレベルの人間とのより良い計量相関をもたらす。
異なる品質のベンダーからの参照は混在し、メートル法の成功を改善することができる。
これらの発見は、特定の予算の下で参照を作成する必要がある場合、共有タスクの評価者によって利用することができる。
論文 参考訳(メタデータ) (2024-01-02T16:51:17Z) - On Search Strategies for Document-Level Neural Machine Translation [51.359400776242786]
文書レベルのニューラルネットワーク変換(NMT)モデルは、ドキュメント全体にわたってより一貫性のある出力を生成する。
そこで本研究では,デコードにおける文脈認識翻訳モデルをどのように活用するか,という質問に答えることを目的としている。
論文 参考訳(メタデータ) (2023-06-08T11:30:43Z) - Competency-Aware Neural Machine Translation: Can Machine Translation
Know its Own Translation Quality? [61.866103154161884]
ニューラルマシン翻訳(NMT)は、意識せずに起こる失敗に対してしばしば批判される。
本稿では,従来のNMTを自己推定器で拡張することで,新たな能力認識型NMTを提案する。
提案手法は品質評価において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-11-25T02:39:41Z) - Rethink about the Word-level Quality Estimation for Machine Translation
from Human Judgement [57.72846454929923]
ベンチマークデータセットであるemphHJQEを作成し、専門家翻訳者が不適切な翻訳語を直接アノテートする。
本稿では,タグリファインメント戦略と木ベースのアノテーション戦略という2つのタグ補正戦略を提案し,TERベースの人工QEコーパスをemphHJQEに近づける。
その結果,提案したデータセットは人間の判断と一致しており,また,提案したタグ補正戦略の有効性も確認できた。
論文 参考訳(メタデータ) (2022-09-13T02:37:12Z) - A Bayesian approach to translators' reliability assessment [0.0]
我々は、複雑なシステムの観点から、翻訳品質評価プロセスを複雑なプロセスとみなす。
TQAプロセスに関わる特徴,すなわち翻訳難易度,翻訳生成と品質評価に関わる翻訳者の特性をパラメータ化する2つのベイズモデルを構築した。
専門家翻訳者であっても、レビュアーの信頼性は当然と言えないことを示す。
論文 参考訳(メタデータ) (2022-03-14T14:29:45Z) - HOPE: A Task-Oriented and Human-Centric Evaluation Framework Using
Professional Post-Editing Towards More Effective MT Evaluation [0.0]
本研究では,機械翻訳出力のためのタスク指向・人間中心評価フレームワークHOPEを紹介する。
一般的に発生するエラーの種類は限られており、各翻訳ユニットにエラー重大度レベルを反映する誤差ペナルティポイント(EPP)の幾何学的進行を伴うスコアリングモデルを使用する。
このアプローチには、異なるシステムからの完全なMT出力を測定および比較する能力、品質に対する人間の認識を示す能力、MT出力を高品質にするために必要となる労力の即時見積、低コストで高速なアプリケーション、より高いIRRなど、いくつかの重要な利点がある。
論文 参考訳(メタデータ) (2021-12-27T18:47:43Z) - Measuring Uncertainty in Translation Quality Evaluation (TQE) [62.997667081978825]
本研究は,翻訳テキストのサンプルサイズに応じて,信頼区間を精度良く推定する動機づけた研究を行う。
我々はベルヌーイ統計分布モデリング (BSDM) とモンテカルロサンプリング分析 (MCSA) の手法を適用した。
論文 参考訳(メタデータ) (2021-11-15T12:09:08Z) - Document-level Neural Machine Translation with Document Embeddings [82.4684444847092]
この研究は、複数の形式の文書埋め込みの観点から、詳細な文書レベルのコンテキストを活用することに重点を置いている。
提案する文書認識NMTは,大域的および局所的な文書レベルの手がかりをソース端に導入することにより,Transformerベースラインを強化するために実装されている。
論文 参考訳(メタデータ) (2020-09-16T19:43:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。