論文の概要: Case-Based Decision-Theoretic Decoding with Quality Memories
- arxiv url: http://arxiv.org/abs/2509.12677v1
- Date: Tue, 16 Sep 2025 05:01:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.898696
- Title: Case-Based Decision-Theoretic Decoding with Quality Memories
- Title(参考訳): 品質記憶を用いたケースベース決定理論復号法
- Authors: Hiroyuki Deguchi, Masaaki Nagata,
- Abstract要約: 最小ベイズリスク (MBR) はテキスト生成の決定規則である。
これは、テキスト生成モデルから引き出されたサンプルテキストに依存する。
ドメイン外の知識や情報を正しく捉える仮説を見つけるのは難しい。
- 参考スコア(独自算出の注目度): 9.995028045771862
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Minimum Bayes risk (MBR) decoding is a decision rule of text generation, which selects the hypothesis that maximizes the expected utility and robustly generates higher-quality texts than maximum a posteriori (MAP) decoding. However, it depends on sample texts drawn from the text generation model; thus, it is difficult to find a hypothesis that correctly captures the knowledge or information of out-of-domain. To tackle this issue, we propose case-based decision-theoretic (CBDT) decoding, another method to estimate the expected utility using examples of domain data. CBDT decoding not only generates higher-quality texts than MAP decoding, but also the combination of MBR and CBDT decoding outperformed MBR decoding in seven domain De--En and Ja$\leftrightarrow$En translation tasks and image captioning tasks on MSCOCO and nocaps datasets.
- Abstract(参考訳): 最小ベイズリスク(MBR)復号法(英: Minimum Bayes risk, MBR)は、テキスト生成の決定規則であり、予測効用を最大化し、最大アフターイ復号法(MAP)よりも高い品質のテキストを堅牢に生成する仮説を選択する。
しかし、これはテキスト生成モデルから得られたサンプルテキストに依存するため、ドメイン外の知識や情報を正しく捉えた仮説を見つけることは困難である。
この問題に対処するため,ケースベース決定理論(CBDT)デコーディングを提案する。
CBDTデコーディングはMAPデコーディングよりも高品質なテキストを生成するだけでなく、MBRとCBDTデコーディングの組み合わせによって、7つのドメインのDe-EnとJa$\leftrightarrow$Enの翻訳タスクと、MSCOCOおよびnocapsデータセット上の画像キャプションタスクより優れたMBRデコーディングを実現している。
関連論文リスト
- Document-Level Text Generation with Minimum Bayes Risk Decoding using Optimal Transport [3.48097307252416]
文書レベルのテキスト生成タスクに対する最小ベイズリスク(MBR)デコードの適用について検討する。
MBRデコードでは、候補出力の集合から最も期待されたユーティリティで出力を推定するためにユーティリティ関数を利用する。
Wasserstein 距離を用いた MBR 復号法の一種である MBR-OT は文レベルユーティリティ関数を用いて文書の有用性を計算する。
論文 参考訳(メタデータ) (2025-05-29T04:34:04Z) - BanditSpec: Adaptive Speculative Decoding via Bandit Algorithms [101.9736063064503]
大規模言語モデル(LLM)の推論を高速化する一般的な手法として、投機的復号法が登場した。
本稿では,テキスト生成時に投機的復号化のためのハイパーパラメータの設定を適応的に選択する学習自由オンライン学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T05:56:31Z) - mbrs: A Library for Minimum Bayes Risk Decoding [27.207891251898904]
mbrsは最小ベイズリスク(MBR)デコーディングのライブラリである。
MBRはテキスト生成タスクの決定ルールであり、従来の最大値(MAP)復号よりも優れている。
私たちはMITライセンスのオープンソースプロジェクトとしてmbrsを公開しました。
論文 参考訳(メタデータ) (2024-08-08T02:28:32Z) - Generating Diverse and High-Quality Texts by Minimum Bayes Risk Decoding [4.209844101827474]
多様性目標を最小ベイズ・リスク復号化に適用することにより,多様性向上のための復号化アルゴリズムを開発した。
我々は、エンコーダデコーダモデルとプロンプト付き大規模言語モデルを用いて、様々な有向テキスト生成タスクにおいてDMBRとKMBRを評価する。
論文 参考訳(メタデータ) (2024-01-10T10:23:41Z) - Quality-Aware Translation Models: Efficient Generation and Quality Estimation in a Single Model [77.19693792957614]
そこで我々は,ニューラルネットワーク翻訳(NMT)モデルを用いて,その品質を学習し,その品質を推定する手法を提案する。
我々は、単一パスの復号化の効率性よりも、品質向上や品質改善のアプローチよりも優れた品質向上を得る。
論文 参考訳(メタデータ) (2023-10-10T15:33:51Z) - Contrastive Decoding: Open-ended Text Generation as Optimization [153.35961722855686]
信頼性の高い復号法であるコントラスト復号法(CD)を提案する。
これは、より大きなLMの故障がより小さなLMでさらに多いという事実に着想を得たものである。
CDは追加のトレーニングを一切必要とせず、より大きなLMからの復号化よりも高品質なテキストを生成する。
論文 参考訳(メタデータ) (2022-10-27T00:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。