論文の概要: MDQE: A More Accurate Direct Pretraining for Machine Translation Quality
Estimation
- arxiv url: http://arxiv.org/abs/2107.14600v1
- Date: Sat, 24 Jul 2021 09:48:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-08 11:27:17.037991
- Title: MDQE: A More Accurate Direct Pretraining for Machine Translation Quality
Estimation
- Title(参考訳): MDQE: 機械翻訳品質推定のためのより正確な事前トレーニング
- Authors: Lei Lin
- Abstract要約: データ品質とトレーニングの目的の両方において,予測器と推定器の間にはまだギャップがある,と我々は主張する。
本稿では,QEタスクに対してより正確な事前学習を提供する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.416484585765028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is expensive to evaluate the results of Machine Translation(MT), which
usually requires manual translation as a reference. Machine Translation Quality
Estimation (QE) is a task of predicting the quality of machine translations
without relying on any reference. Recently, the emergence of
predictor-estimator framework which trains the predictor as a feature extractor
and estimator as a QE predictor, and pre-trained language models(PLM) have
achieved promising QE performance. However, we argue that there are still gaps
between the predictor and the estimator in both data quality and training
objectives, which preclude QE models from benefiting from a large number of
parallel corpora more directly. Based on previous related work that have
alleviated gaps to some extent, we propose a novel framework that provides a
more accurate direct pretraining for QE tasks. In this framework, a generator
is trained to produce pseudo data that is closer to the real QE data, and a
estimator is pretrained on these data with novel objectives that are the same
as the QE task. Experiments on widely used benchmarks show that our proposed
framework outperforms existing methods, without using any pretraining models
such as BERT.
- Abstract(参考訳): 通常、機械翻訳(mt)の結果を評価するのは高価である。
機械翻訳品質推定(英: Machine Translation Quality Estimation、QE)とは、機械翻訳の品質を基準に頼らずに予測するタスクである。
近年,予測器を特徴抽出器として,推定器をQE予測器として訓練する予測器・推定器フレームワークが出現し,事前学習言語モデル(PLM)が有望なQE性能を達成した。
しかしながら、データ品質とトレーニング目標の両方において、予測者と推定者の間にはまだギャップがあり、qeモデルが多数の並列コーパスから直接恩恵を受けることを妨げると主張している。
ギャップをある程度緩和した先行研究に基づいて,より正確なqeタスクの事前学習を実現するための新しいフレームワークを提案する。
このフレームワークでは、生成器が実際のQEデータに近い擬似データを生成するように訓練され、これらのデータに対して、QEタスクと同じ新しい目的を持つ推定器が事前訓練される。
提案するフレームワークは,BERTなどの事前学習モデルを用いることなく,既存の手法よりも優れていることを示す。
関連論文リスト
- Improving Machine Translation with Human Feedback: An Exploration of Quality Estimation as a Reward Model [75.66013048128302]
本研究では,QEモデルを報酬モデルとして活用し,フィードバックトレーニングにおける人間の嗜好を予測する可能性について検討する。
まず,QEに基づくフィードバックトレーニングにおいて,翻訳品質が低下する中で,報酬の増大として現れる過度な最適化問題を同定した。
問題に対処するために,ルールを用いて誤った翻訳を検知し,報酬のスコアにペナルティ項を割り当てる,シンプルで効果的な手法を採用する。
論文 参考訳(メタデータ) (2024-01-23T16:07:43Z) - How to Estimate Model Transferability of Pre-Trained Speech Models? [84.11085139766108]
事前学習音声モデルの伝達可能性推定のためのスコアベースアセスメントフレームワーク
ベイズ確率推定と最適輸送という2つの表現理論を利用して、PSM候補のランクスコアを生成する。
本フレームワークは,候補モデルやレイヤを実際に微調整することなく,転送可能性スコアを効率的に計算する。
論文 参考訳(メタデータ) (2023-06-01T04:52:26Z) - PreQuEL: Quality Estimation of Machine Translation Outputs in Advance [32.922128367314194]
PreQuELシステムは、実際の翻訳とは無関係に、ある文がどの程度翻訳されるかを予測する。
タスクのベースラインモデルを開発し,その性能を解析する。
本手法は,品質評価タスクの性能向上にも有効であることを示す。
論文 参考訳(メタデータ) (2022-05-18T18:55:05Z) - Translation Error Detection as Rationale Extraction [36.616561917049076]
本稿では,現在最先端の文レベルQEモデルの振る舞いについて検討し,翻訳誤りを検出するために実際に説明が利用できることを示す。
単語レベルQEのための新しい半教師付き手法を導入し、(ii)特徴属性の妥当性を評価するための新しいベンチマークとしてQEタスクを提案する。
論文 参考訳(メタデータ) (2021-08-27T09:35:14Z) - Knowledge Distillation for Quality Estimation [79.51452598302934]
QE(Quality Estimation)は、参照翻訳のない機械翻訳の品質を自動的に予測するタスクである。
QEの最近の成功は、非常に大きなモデルが印象的な結果をもたらす多言語事前学習表現の使用に起因している。
提案手法は, データ拡張と組み合わせて, 8倍のパラメータを持つ蒸留前学習表現と競合する軽量QEモデルをもたらすことを示す。
論文 参考訳(メタデータ) (2021-07-01T12:36:21Z) - Ensemble-based Transfer Learning for Low-resource Machine Translation
Quality Estimation [1.7188280334580195]
第5回機械翻訳会議(WMT20)の文レベルQE共有タスクに焦点を当てます。
このようなQEデータ不足の課題を克服するために、トランスファーラーニングを備えたアンサンブルベースの予測器推定QEモデルを提案する。
個々の言語で事前学習されたモデルと異なるレベルの並列学習コーパスと、ピアソンの相関値0.298とを組み合わせたアンサンブルモデルにおいて、最も優れた性能を実現する。
論文 参考訳(メタデータ) (2021-05-17T06:02:17Z) - DirectQE: Direct Pretraining for Machine Translation Quality Estimation [41.187833219223336]
データ品質とトレーニングの目的の両方において,予測器と推定器の間にはギャップがある,と我々は主張する。
我々は、QEタスクの直接事前学習を提供するDirectQEと呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-15T06:18:49Z) - Unsupervised Quality Estimation for Neural Machine Translation [63.38918378182266]
既存のアプローチでは、大量の専門家アノテートデータ、計算、トレーニング時間が必要です。
MTシステム自体以外に、トレーニングや追加リソースへのアクセスが不要なQEに対して、教師なしのアプローチを考案する。
我々は品質の人間の判断と非常によく相関し、最先端の教師付きQEモデルと競合する。
論文 参考訳(メタデータ) (2020-05-21T12:38:06Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。