論文の概要: Machine Translation Decoding beyond Beam Search
- arxiv url: http://arxiv.org/abs/2104.05336v1
- Date: Mon, 12 Apr 2021 10:28:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:36:11.556529
- Title: Machine Translation Decoding beyond Beam Search
- Title(参考訳): ビーム探索を超えた機械翻訳復号
- Authors: R\'emi Leblond, Jean-Baptiste Alayrac, Laurent Sifre, Miruna Pislar,
Jean-Baptiste Lespiau, Ioannis Antonoglou, Karen Simonyan and Oriol Vinyals
- Abstract要約: ビームサーチは自動回帰機械翻訳モデルの復号化手法である。
我々の目標は、ビームサーチがより強力な計量駆動サーチ技術に置き換えられるかどうかを確かめることである。
モンテカルロ木探索(mcts)に基づく手法を導入し,その競合性を示す。
- 参考スコア(独自算出の注目度): 43.27883368285612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Beam search is the go-to method for decoding auto-regressive machine
translation models. While it yields consistent improvements in terms of BLEU,
it is only concerned with finding outputs with high model likelihood, and is
thus agnostic to whatever end metric or score practitioners care about. Our aim
is to establish whether beam search can be replaced by a more powerful
metric-driven search technique. To this end, we explore numerous decoding
algorithms, including some which rely on a value function parameterised by a
neural network, and report results on a variety of metrics. Notably, we
introduce a Monte-Carlo Tree Search (MCTS) based method and showcase its
competitiveness. We provide a blueprint for how to use MCTS fruitfully in
language applications, which opens promising future directions. We find that
which algorithm is best heavily depends on the characteristics of the goal
metric; we believe that our extensive experiments and analysis will inform
further research in this area.
- Abstract(参考訳): ビームサーチは自動回帰機械翻訳モデルの復号化手法である。
BLEUの観点で一貫した改善をもたらすが、それは高いモデル確率で出力を見つけることだけに関係しており、したがって、エンドメトリックスやスコアの実践者が関心を持つものとは無関係である。
我々の目標は、ビームサーチがより強力な計量駆動サーチ技術に置き換えられるかどうかを確かめることである。
この目的のために,ニューラルネットワークによってパラメータ化される値関数に依存するものや,さまざまなメトリクスによる結果報告など,多数の復号アルゴリズムを探索する。
特に,モンテカルロ木探索(MCTS)に基づく手法を導入し,その競争力を示す。
我々は、言語アプリケーションでMCTSを実りよく使う方法の青写真を提供し、将来有望な方向性を開く。
我々は、どのアルゴリズムがゴールメトリックの特徴に最も大きく依存しているかを見いだし、我々の広範な実験と分析がこの分野のさらなる研究に役立つと信じている。
関連論文リスト
- Retrieval with Learned Similarities [2.729516456192901]
最先端の検索アルゴリズムは、学習された類似点に移行した。
そこで本研究では,Mixture-of-Logits (MoL) を実証的に実現し,多様な検索シナリオにおいて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2024-07-22T08:19:34Z) - Evaluating Embedding APIs for Information Retrieval [51.24236853841468]
ドメインの一般化と多言語検索における既存のセマンティック埋め込みAPIの機能を評価する。
BM25の結果をAPIを使って再ランク付けすることは、予算に優しいアプローチであり、英語でもっとも効果的である。
非英語検索では、再ランク付けは結果を改善するが、BM25のハイブリッドモデルは高いコストで機能する。
論文 参考訳(メタデータ) (2023-05-10T16:40:52Z) - Quality-Aware Decoding for Neural Machine Translation [64.24934199944875]
ニューラルネットワーク翻訳(NMT)のための品質認識復号法を提案する。
参照フリーおよび参照ベースMT評価における最近のブレークスルーを,様々な推論手法を用いて活用する。
品質認識復号化は、最先端の自動測定値と人的評価値の両方で、MAPベースの復号化を一貫して上回ります。
論文 参考訳(メタデータ) (2022-05-02T15:26:28Z) - A Call for Clarity in Beam Search: How It Works and When It Stops [125.55175954381991]
我々は、このビーム復号化実装の簡単な修正である忍耐係数を導入し、停止基準を一般化し、探索深度に柔軟性を提供する。
実験結果から,この忍耐率の調整は,ニューステキスト要約および多言語対における機械翻訳において,強い事前学習されたモデルの復号性能を向上させることが示された。
論文 参考訳(メタデータ) (2022-04-11T22:03:44Z) - Enabling arbitrary translation objectives with Adaptive Tree Search [23.40984370716434]
本研究では,適応木探索アルゴリズムを導入し,探索対象の形状や構造を仮定しない翻訳モデルの下で高いスコア付け出力を求める。
我々のアルゴリズムはビームサーチとは異なるバイアスを有しており、自己回帰モデルにおけるデコードバイアスの役割を新たに解析することができる。
論文 参考訳(メタデータ) (2022-02-23T11:48:26Z) - Sampling-Based Minimum Bayes Risk Decoding for Neural Machine
Translation [20.76001576262768]
本研究では,最小ベイズリスク (MBR) 復号化に対するサンプリングに基づく近似がビーム探索の呪文と等価でないことを示す。
また,ビーム探索や核サンプリングといった手法を用いて仮説空間を効率的に構築することが有用であることを示す。
論文 参考訳(メタデータ) (2021-08-10T14:35:24Z) - Rethinking the Evaluation of Neural Machine Translation [25.036685025571927]
本稿では,探索誤りの影響を回避し,モデルランキングの観点からシステムレベルの評価を行う新しい評価プロトコルを提案する。
提案手法は,ビームサーチではなく,新たに提案した最上位k$デコードに基づく。
論文 参考訳(メタデータ) (2021-06-29T09:59:50Z) - Determinantal Beam Search [75.84501052642361]
ビームサーチは、ニューラルシーケンスモデルをデコードするためのゴーツー戦略である。
複数のソリューションを要求するユースケースでは、多様あるいは代表的なセットがしばしば望まれる。
ビームサーチを一連の部分決定問題として繰り返し行うことにより、アルゴリズムを多種多様なサブセット選択プロセスに変換することができる。
論文 参考訳(メタデータ) (2021-06-14T13:01:46Z) - If beam search is the answer, what was the question? [78.71330480725668]
ビームサーチは、認知科学に動機づけられた特性であるテキストの均一な情報密度を強制する。
この特性を明示的に強制する復号対象のセットを提案し、これらの目的による正確な復号化は、校正の不十分な言語生成モデルの復号時に発生する問題を緩和する。
論文 参考訳(メタデータ) (2020-10-06T11:57:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。