論文の概要: Quality Control at Your Fingertips: Quality-Aware Translation Models
- arxiv url: http://arxiv.org/abs/2310.06707v1
- Date: Tue, 10 Oct 2023 15:33:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 14:45:32.374041
- Title: Quality Control at Your Fingertips: Quality-Aware Translation Models
- Title(参考訳): 指先での品質管理:品質を意識した翻訳モデル
- Authors: Christian Tomani, David Vilar, Markus Freitag, Colin Cherry, Subhajit
Naskar, Mara Finkelstein and Daniel Cremers
- Abstract要約: 我々は、ニューラルネットワーク翻訳(NMT)モデルを作成し、彼らの出力の品質を推定するように訓練する。
本モデルでは,翻訳中の出力を自己評価し,別の品質推定モデルの必要性を排除できることを実証する。
- 参考スコア(独自算出の注目度): 68.52894284085394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Maximum-a-posteriori (MAP) decoding is the most widely used decoding strategy
for neural machine translation (NMT) models. The underlying assumption is that
model probability correlates well with human judgment, with better translations
being more likely. However, research has shown that this assumption does not
always hold, and decoding strategies which directly optimize a utility
function, like Minimum Bayes Risk (MBR) or Quality-Aware decoding can
significantly improve translation quality over standard MAP decoding. The main
disadvantage of these methods is that they require an additional model to
predict the utility, and additional steps during decoding, which makes the
entire process computationally demanding. In this paper, we propose to make the
NMT models themselves quality-aware by training them to estimate the quality of
their own output. During decoding, we can use the model's own quality estimates
to guide the generation process and produce the highest-quality translations
possible. We demonstrate that the model can self-evaluate its own output during
translation, eliminating the need for a separate quality estimation model.
Moreover, we show that using this quality signal as a prompt during MAP
decoding can significantly improve translation quality. When using the internal
quality estimate to prune the hypothesis space during MBR decoding, we can not
only further improve translation quality, but also reduce inference speed by
two orders of magnitude.
- Abstract(参考訳): MAPデコーディングは、ニューラルネットワーク翻訳(NMT)モデルにおいて最も広く使われているデコーディング戦略である。
基礎となる前提は、モデル確率は人間の判断とよく相関し、より良い翻訳がよりありそうである。
しかし、この仮定が常に成り立つわけではなく、最小ベイズリスク(MBR)や品質認識復号といったユーティリティ機能を直接最適化する復号化戦略は、標準MAP復号よりも翻訳品質を著しく向上させることができる。
これらの手法の主な欠点は、実用性を予測するために追加のモデルが必要であり、デコード中に追加のステップが必要であることである。
本稿では,NMTモデル自体の品質を学習し,その品質を推定することで,NMTモデル自体を品質に適応させることを提案する。
復号の際には、モデル自身の品質推定値を用いて生成プロセスを導出し、可能な限り高品質な翻訳を作成できる。
本モデルでは,翻訳中の出力を自己評価し,別の品質推定モデルの必要性を排除できることを実証する。
さらに,地図デコード中のプロンプトとしてこの品質信号を用いることにより,翻訳品質が著しく向上することを示す。
内部品質推定を用いてmbr復号中に仮説空間を損なう場合, 翻訳品質をさらに向上させるだけでなく, 推定速度を2桁削減することができる。
関連論文リスト
- DSTC: Direct Preference Learning with Only Self-Generated Tests and Code to Improve Code LMs [56.24431208419858]
UnderlinetextbfDirect Preference Learning with only underlinetextbfSelf-Generated underlinetextbfTests and underlinetextbfCode (DSTC)を紹介する。
DSTCは自己生成コードスニペットとテストのみを使用して信頼性の高い選好ペアを構築する。
論文 参考訳(メタデータ) (2024-11-20T02:03:16Z) - Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation [30.323103270892734]
ニューラルマシン翻訳(NMT)の一般的な手法である、最大後部復号法は、推定後部確率を最大化することを目的としている。
最小ベイズリスク(MBR)復号法は、最も期待されているユーティリティで仮説を求める方法を提供する。
論文 参考訳(メタデータ) (2024-06-17T15:13:52Z) - MBR and QE Finetuning: Training-time Distillation of the Best and Most Expensive Decoding Methods [13.56549575939123]
モデルパープレキシティとvs品質のミスマッチを軽減するために、ファインタニングとQEファインタニングを提案する。
自己学習においても,これらのファインタニング手法はベースモデルよりも有意に優れていることを示す。
これらの結果は、モノリンガルデータを活用する新たな方法が、人間の計算データと同等かそれ以上のモデル品質の向上を実現することを示唆している。
論文 参考訳(メタデータ) (2023-09-19T23:39:07Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Quality-Aware Decoding for Neural Machine Translation [64.24934199944875]
ニューラルネットワーク翻訳(NMT)のための品質認識復号法を提案する。
参照フリーおよび参照ベースMT評価における最近のブレークスルーを,様々な推論手法を用いて活用する。
品質認識復号化は、最先端の自動測定値と人的評価値の両方で、MAPベースの復号化を一貫して上回ります。
論文 参考訳(メタデータ) (2022-05-02T15:26:28Z) - Efficient Decoding of Surface Code Syndromes for Error Correction in
Quantum Computing [0.09236074230806578]
本稿では,2レベル(低レベル,高レベル)のMLベースの復号法を提案し,第1レベルが物理量子ビット上の誤りを訂正し,第2レベルが既存の論理的誤りを訂正する。
その結果,提案手法は擬似閾値としきい値のそれぞれ$sim10倍,$sim2倍の値が得られることがわかった。
より高度な訓練/テスト時間を持つMLモデルの使用は、デコーダの性能に大きな改善をもたらすものではないことを示す。
論文 参考訳(メタデータ) (2021-10-21T04:54:44Z) - Model Selection for Bayesian Autoencoders [25.619565817793422]
本稿では,オートエンコーダの出力と経験的データ分布との分散スライス-ワッサーシュタイン距離を最適化することを提案する。
我々のBAEは、フレキシブルなディリクレ混合モデルを潜在空間に適合させることにより、生成モデルに変換する。
我々は,教師なしの学習課題に対する膨大な実験的キャンペーンを質的かつ定量的に評価し,先行研究が重要となる小規模データ体制において,我々のアプローチが最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2021-06-11T08:55:00Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Discovering Representations for Black-box Optimization [73.59962178534361]
ブラックボックス最適化符号化は手作業で行うのではなく,自動的に学習可能であることを示す。
学習された表現は、標準的なMAP-Elitesよりも桁違いに少ない評価で高次元の問題を解くことができることを示す。
論文 参考訳(メタデータ) (2020-03-09T20:06:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。