論文の概要: Competency-Aware Neural Machine Translation: Can Machine Translation
Know its Own Translation Quality?
- arxiv url: http://arxiv.org/abs/2211.13865v1
- Date: Fri, 25 Nov 2022 02:39:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 14:50:37.073004
- Title: Competency-Aware Neural Machine Translation: Can Machine Translation
Know its Own Translation Quality?
- Title(参考訳): 能力認識ニューラルマシン翻訳:機械翻訳は自身の翻訳品質を知ることができるか?
- Authors: Pei Zhang, Baosong Yang, Haoran Wei, Dayiheng Liu, Kai Fan, Luo Si and
Jun Xie
- Abstract要約: ニューラルマシン翻訳(NMT)は、意識せずに起こる失敗に対してしばしば批判される。
本稿では,従来のNMTを自己推定器で拡張することで,新たな能力認識型NMTを提案する。
提案手法は品質評価において優れた性能を示すことを示す。
- 参考スコア(独自算出の注目度): 61.866103154161884
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Neural machine translation (NMT) is often criticized for failures that happen
without awareness. The lack of competency awareness makes NMT untrustworthy.
This is in sharp contrast to human translators who give feedback or conduct
further investigations whenever they are in doubt about predictions. To fill
this gap, we propose a novel competency-aware NMT by extending conventional NMT
with a self-estimator, offering abilities to translate a source sentence and
estimate its competency. The self-estimator encodes the information of the
decoding procedure and then examines whether it can reconstruct the original
semantics of the source sentence. Experimental results on four translation
tasks demonstrate that the proposed method not only carries out translation
tasks intact but also delivers outstanding performance on quality estimation.
Without depending on any reference or annotated data typically required by
state-of-the-art metric and quality estimation methods, our model yields an
even higher correlation with human quality judgments than a variety of
aforementioned methods, such as BLEURT, COMET, and BERTScore. Quantitative and
qualitative analyses show better robustness of competency awareness in our
model.
- Abstract(参考訳): ニューラルマシン翻訳(NMT)は、意識せずに起こる失敗に対してしばしば批判される。
能力意識の欠如はNMTを信頼できないものにしている。
これは、人間の翻訳者が予測に疑念を抱くたびにフィードバックやさらなる調査を行うのとは対照的である。
このギャップを埋めるために、従来のNMTを自己推定器で拡張し、ソース文を翻訳し、その能力を評価する能力を提供することにより、新しい能力認識NMTを提案する。
自己推定子は復号処理の情報を符号化し、原文の本来の意味を再構築できるかどうかを調べる。
4つの翻訳タスクにおける実験結果から,提案手法は翻訳タスクを無傷で実行するだけでなく,品質推定に優れた性能をもたらすことが示された。
最先端の計量法や品質評価法で通常必要とされる参照データや注釈データに頼らず、上記のBLEURT, COMET, BERTScoreなどの様々な手法よりも、人間の品質判断とさらに高い相関性が得られる。
定量的および定性的な分析は、我々のモデルにおける能力意識の堅牢性を示す。
関連論文リスト
- Understanding and Addressing the Under-Translation Problem from the Perspective of Decoding Objective [72.83966378613238]
最新のニューラル・マシン・トランスレーション(NMT)システムでは、アンダー・トランスレーションとオーバー・トランスレーションの2つの課題が残っている。
我々は,NMTにおけるアンダートランスレーションの根本原因を詳細に分析し,デコード目的の観点から解説する。
本研究は,低翻訳の検知器としてEOS(End Of Sentence)予測の信頼性を活用し,低翻訳のリスクが高い候補を罰する信頼性に基づくペナルティを強化することを提案する。
論文 参考訳(メタデータ) (2024-05-29T09:25:49Z) - Iterative Translation Refinement with Large Language Models [25.90607157524168]
本稿では,翻訳を自己修正するために,大規模言語モデルを反復的に提案する。
また,評価における課題と,人間のパフォーマンスと翻訳との関係についても論じる。
論文 参考訳(メタデータ) (2023-06-06T16:51:03Z) - Rethink about the Word-level Quality Estimation for Machine Translation
from Human Judgement [57.72846454929923]
ベンチマークデータセットであるemphHJQEを作成し、専門家翻訳者が不適切な翻訳語を直接アノテートする。
本稿では,タグリファインメント戦略と木ベースのアノテーション戦略という2つのタグ補正戦略を提案し,TERベースの人工QEコーパスをemphHJQEに近づける。
その結果,提案したデータセットは人間の判断と一致しており,また,提案したタグ補正戦略の有効性も確認できた。
論文 参考訳(メタデータ) (2022-09-13T02:37:12Z) - Understanding and Mitigating the Uncertainty in Zero-Shot Translation [92.25357943169601]
ゼロショット翻訳の不確実性の観点から、オフターゲット問題を理解し、緩和することを目的としている。
そこで本研究では,モデルトレーニングのためのトレーニングデータを認知するための,軽量かつ補完的な2つのアプローチを提案する。
提案手法は,強いMNMTベースライン上でのゼロショット翻訳の性能を著しく向上させる。
論文 参考訳(メタデータ) (2022-05-20T10:29:46Z) - A Bayesian approach to translators' reliability assessment [0.0]
我々は、複雑なシステムの観点から、翻訳品質評価プロセスを複雑なプロセスとみなす。
TQAプロセスに関わる特徴,すなわち翻訳難易度,翻訳生成と品質評価に関わる翻訳者の特性をパラメータ化する2つのベイズモデルを構築した。
専門家翻訳者であっても、レビュアーの信頼性は当然と言えないことを示す。
論文 参考訳(メタデータ) (2022-03-14T14:29:45Z) - HOPE: A Task-Oriented and Human-Centric Evaluation Framework Using
Professional Post-Editing Towards More Effective MT Evaluation [0.0]
本研究では,機械翻訳出力のためのタスク指向・人間中心評価フレームワークHOPEを紹介する。
一般的に発生するエラーの種類は限られており、各翻訳ユニットにエラー重大度レベルを反映する誤差ペナルティポイント(EPP)の幾何学的進行を伴うスコアリングモデルを使用する。
このアプローチには、異なるシステムからの完全なMT出力を測定および比較する能力、品質に対する人間の認識を示す能力、MT出力を高品質にするために必要となる労力の即時見積、低コストで高速なアプリケーション、より高いIRRなど、いくつかの重要な利点がある。
論文 参考訳(メタデータ) (2021-12-27T18:47:43Z) - Measuring Uncertainty in Translation Quality Evaluation (TQE) [62.997667081978825]
本研究は,翻訳テキストのサンプルサイズに応じて,信頼区間を精度良く推定する動機づけた研究を行う。
我々はベルヌーイ統計分布モデリング (BSDM) とモンテカルロサンプリング分析 (MCSA) の手法を適用した。
論文 参考訳(メタデータ) (2021-11-15T12:09:08Z) - BLEU, METEOR, BERTScore: Evaluation of Metrics Performance in Assessing
Critical Translation Errors in Sentiment-oriented Text [1.4213973379473654]
オンラインコンテンツの機械翻訳(MT)は、複数の言語で書かれた投稿の処理に一般的に使用される。
本稿では,機械翻訳の致命的誤りを検出するための自動品質指標の有効性を評価する。
我々は、感情クリティカルなエラーの検出をより堅牢にするために、自動メトリクスの微調整が必要であると結論付けている。
論文 参考訳(メタデータ) (2021-09-29T07:51:17Z) - Uncertainty-Aware Machine Translation Evaluation [0.716879432974126]
我々は,不確実性を考慮したMT評価を導入し,予測品質の信頼性を分析した。
QT21データセットとWMT20メトリクスタスクから,複数の言語ペア間での不確実性を考慮したMT評価手法の性能を比較した。
論文 参考訳(メタデータ) (2021-09-13T22:46:03Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。