論文の概要: Agreement-Constrained Probabilistic Minimum Bayes Risk Decoding
- arxiv url: http://arxiv.org/abs/2512.01316v1
- Date: Mon, 01 Dec 2025 06:16:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.709268
- Title: Agreement-Constrained Probabilistic Minimum Bayes Risk Decoding
- Title(参考訳): 合意制約付き確率的最小ベイズリスクデコード
- Authors: Koki Natsumi, Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe,
- Abstract要約: 本稿では,知識蒸留モデルを利用してスコア行列の完成を導出する,合意制約付きPMBR復号法を提案する。
我々のAC-PMBR復号法は,行列補完の近似誤差を最大3倍に改善し,PMBR復号法と比較して高い翻訳品質を実現した。
- 参考スコア(独自算出の注目度): 51.82883249233765
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Minimum Bayes risk (MBR) decoding generates high-quality translations by maximizing the expected utility of output candidates, but it evaluates all pairwise scores over the candidate set; hence, it takes quadratic time with respect to the number of candidates. To reduce the number of utility function calls, probabilistic MBR (PMBR) decoding partially evaluates quality scores using sampled pairs of candidates and completes the missing scores with a matrix completion algorithm. Nevertheless, it degrades the translation quality as the number of utility function calls is reduced. Therefore, to improve the trade-off between quality and cost, we propose agreement-constrained PMBR (AC-PMBR) decoding, which leverages a knowledge distilled model to guide the completion of the score matrix. Our AC-PMBR decoding improved approximation errors of matrix completion by up to 3 times and achieved higher translation quality compared with PMBR decoding at a comparable computational cost on the WMT'23 En$\leftrightarrow$De translation tasks.
- Abstract(参考訳): 最小ベイズリスク(MBR)復号(英語版)は、出力候補の期待効用を最大化することで高品質な翻訳を生成するが、候補集合よりも全てのペアのスコアを評価するため、候補数に関して2次時間を要する。
実用関数呼び出しの回数を減らすため、確率的MBRデコード(PMBR)は、サンプルペアの候補を用いて品質スコアを部分的に評価し、行列補完アルゴリズムを用いて欠落スコアを完遂する。
それでも、ユーティリティ関数呼び出しの数が減少するにつれて、翻訳品質が低下する。
そこで我々は,品質とコストのトレードオフを改善するために,知識蒸留モデルを利用してスコア行列の完成を導出する合意制約PMBR(AC-PMBR)デコーディングを提案する。
我々のAC-PMBR復号法は行列補完の近似誤差を最大3倍に改善し,WMT'23 En$\leftrightarrow$De翻訳の計算コストに匹敵するPMBR復号法よりも高い翻訳品質を実現した。
関連論文リスト
- Minimum Bayes Risk Decoding for Error Span Detection in Reference-Free Automatic Machine Translation Evaluation [50.83502171176548]
Maximum a Posteriori (MAP) を用いた最新造形ESD法
生成ESDモデルに最小ベイズリスク(MBR)デコードを適用することでこの問題に対処する。
論文 参考訳(メタデータ) (2025-12-08T13:21:44Z) - Better Instruction-Following Through Minimum Bayes Risk [48.879360919760074]
人間レベルの評価が可能な汎用LLM審査員は、命令追従LLMを評価するスケーラブルで正確な方法を提供する。
LLM判事を監督に活用する有望な方法の1つは、最小ベイズリスク(MBR)デコーディングである。
MBRデコードでは、基準ベースの評価器を使用して、候補出力のセットの中から高品質な出力を選択する。
論文 参考訳(メタデータ) (2024-10-03T18:48:38Z) - Efficient Minimum Bayes Risk Decoding using Low-Rank Matrix Completion Algorithms [19.543681023903456]
行列補完問題として最小ベイズリスク(MBR)デコーディングを定式化する。
我々は、スコアのランダムな部分集合のみを計算し、行列の欠落したエントリを効率的に回収することでこれを活用する。
機械翻訳タスクに対する実験結果から,提案手法は1/16の有効量計算を必要とすることが示された。
論文 参考訳(メタデータ) (2024-06-05T00:54:03Z) - Centroid-Based Efficient Minimum Bayes Risk Decoding [38.04403087991526]
最小ベイズリスク(MBR)復号化はCOMETを用いて最先端の翻訳性能を達成した。
MBR復号法は、翻訳仮説とすべての参照翻訳の間の期待スコアを計算するため、2次時間を必要とする。
提案手法は特徴空間内の参照翻訳をクラスタリングし,各クラスタのセントロイドを用いてスコアを算出する。
論文 参考訳(メタデータ) (2024-02-17T05:15:12Z) - Linear-time Minimum Bayes Risk Decoding with Reference Aggregation [52.1701152610258]
最小ベイズリスク(MBR、Minimum Bayes Risk)は、機械翻訳の品質向上を図ったテキスト生成技術である。
これは2次複雑性を持つ実用計量のペアワイズ計算を必要とする。
本稿では,集約された参照表現に対して計算したスコアを用いて,ペアワイズメトリックスコアを近似する。
論文 参考訳(メタデータ) (2024-02-06T18:59:30Z) - Faster Minimum Bayes Risk Decoding with Confidence-based Pruning [8.709382540743391]
本稿では,最小ベイズリスク(MBR)復号化アルゴリズムについて述べる。
提案手法では, サンプルが少なく, 実用機能への呼び出し回数を標準のMBRに比べて大幅に削減する。
実用・評価指標として chrF++ と COMET を用いた3つの言語対の実験において,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2023-11-25T03:38:14Z) - Quality-Aware Translation Models: Efficient Generation and Quality Estimation in a Single Model [77.19693792957614]
そこで我々は,ニューラルネットワーク翻訳(NMT)モデルを用いて,その品質を学習し,その品質を推定する手法を提案する。
我々は、単一パスの復号化の効率性よりも、品質向上や品質改善のアプローチよりも優れた品質向上を得る。
論文 参考訳(メタデータ) (2023-10-10T15:33:51Z) - Quality-Aware Decoding for Neural Machine Translation [64.24934199944875]
ニューラルネットワーク翻訳(NMT)のための品質認識復号法を提案する。
参照フリーおよび参照ベースMT評価における最近のブレークスルーを,様々な推論手法を用いて活用する。
品質認識復号化は、最先端の自動測定値と人的評価値の両方で、MAPベースの復号化を一貫して上回ります。
論文 参考訳(メタデータ) (2022-05-02T15:26:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。