論文の概要: Machine Translation System Selection from Bandit Feedback
- arxiv url: http://arxiv.org/abs/2002.09646v2
- Date: Wed, 2 Sep 2020 04:14:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 19:29:00.466317
- Title: Machine Translation System Selection from Bandit Feedback
- Title(参考訳): バンディットフィードバックによる機械翻訳システム選択
- Authors: Jason Naradowsky, Xuan Zhang, Kevin Duh
- Abstract要約: 実世界における機械翻訳システムへの適応は難しい問題である。
異なるアーキテクチャ、データセット、最適化手法を用いて、多くの翻訳システムを訓練する。
提案手法は,(1)翻訳タスクにおけるドメイン変更に迅速に対応できること,(2)混合ドメイン翻訳タスクにおいて単一最良システムより優れていること,(3)インスタンス固有決定を効果的に行うこと,などを示す。
- 参考スコア(独自算出の注目度): 16.628621430608977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adapting machine translation systems in the real world is a difficult
problem. In contrast to offline training, users cannot provide the type of
fine-grained feedback (such as correct translations) typically used for
improving the system. Moreover, different users have different translation
needs, and even a single user's needs may change over time.
In this work we take a different approach, treating the problem of adaptation
as one of selection. Instead of adapting a single system, we train many
translation systems using different architectures, datasets, and optimization
methods. Using bandit learning techniques on simulated user feedback, we learn
a policy to choose which system to use for a particular translation task. We
show that our approach can (1) quickly adapt to address domain changes in
translation tasks, (2) outperform the single best system in mixed-domain
translation tasks, and (3) make effective instance-specific decisions when
using contextual bandit strategies.
- Abstract(参考訳): 実世界における機械翻訳システムへの適応は難しい問題である。
オフライントレーニングとは対照的に、ユーザはシステム改善に一般的に使用される細かなフィードバック(正しい翻訳など)のタイプを提供できない。
さらに、異なるユーザは異なる翻訳ニーズを持ち、単一のユーザのニーズさえ時間が経つにつれて変わる可能性がある。
本研究では、適応の問題を選択の1つとして扱い、異なるアプローチをとる。
単一のシステムを適用する代わりに、異なるアーキテクチャ、データセット、最適化メソッドを使用して多くの翻訳システムをトレーニングします。
ユーザフィードバックを模擬した帯域学習技術を用いて,特定の翻訳タスクに使用するシステムを選択するためのポリシーを学習する。
提案手法は,(1)翻訳タスクにおけるドメイン変更に迅速に対応できること,(2)混合ドメイン翻訳タスクにおいて単一最良システムより優れていること,(3)コンテキスト的バンディット戦略を用いる場合のインスタンス固有決定を効果的に行うこと,などを示す。
関連論文リスト
- LEAPT: Learning Adaptive Prefix-to-prefix Translation For Simultaneous
Machine Translation [6.411228564798412]
機械翻訳は、多くのライブシナリオで有用であるが、精度とレイテンシのトレードオフのため非常に難しい。
LEAPTと呼ばれる新しい適応型トレーニングポリシーを提案し、それによって機械翻訳モデルがソースプレフィックスの翻訳方法を学習し、将来の文脈を活用することができる。
論文 参考訳(メタデータ) (2023-03-21T11:17:37Z) - Building Multilingual Machine Translation Systems That Serve Arbitrary
X-Y Translations [75.73028056136778]
任意のX-Y翻訳方向に対応するMNMTシステムを実際に構築する方法を示す。
また,本提案手法を,実用的な展開シナリオに対応するため,極めて大規模なデータ設定で検討した。
論文 参考訳(メタデータ) (2022-06-30T02:18:15Z) - Data-Driven Adaptive Simultaneous Machine Translation [51.01779863078624]
適応型SimulMTのための新しい,効率的なトレーニング手法を提案する。
本手法は,翻訳の質やレイテンシという点で,全ての強靭なベースラインを上回ります。
論文 参考訳(メタデータ) (2022-04-27T02:40:21Z) - Exploring Continuous Integrate-and-Fire for Adaptive Simultaneous Speech
Translation [75.86581380817464]
SimulSTシステムは通常、音声情報を集約する事前決定と、読み書きを決定するポリシーの2つのコンポーネントを含む。
本稿では,CIF(Continuous Integrate-and-Fire)を適用して適応政策をモデル化することを提案する。
単調なマルチヘッドアテンション (MMA) と比較して,本手法はより単純な計算,低レイテンシにおける品質,長い発話の一般化に優れる。
論文 参考訳(メタデータ) (2022-03-22T23:33:18Z) - Onception: Active Learning with Expert Advice for Real World Machine
Translation [0.0]
機械翻訳の最も活発な学習アプローチは、ソース言語における文プールの存在を前提としており、翻訳または後編集を提供するために人間のアノテーションに依存している。
本稿では, 実世界のヒューマン・イン・ザ・ループのシナリオを仮定する。 (i) 原文は簡単には入手できないが, ストリームに到達し, (ii) 自動翻訳は, 正しい/編集された翻訳ではなく, 評価の形でフィードバックを受ける。
論文 参考訳(メタデータ) (2022-03-09T03:32:42Z) - Non-Parametric Online Learning from Human Feedback for Neural Machine
Translation [54.96594148572804]
本稿では,人間のフィードバックによるオンライン学習の課題について検討する。
従来手法では、高品質な性能を達成するために、オンラインモデル更新や翻訳メモリネットワークの追加が必要であった。
モデル構造を変更することなく、新しい非パラメトリックオンライン学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-23T04:26:15Z) - Bilingual Mutual Information Based Adaptive Training for Neural Machine
Translation [38.83163343372786]
本稿では,両言語主義の観点から,目標トークンの学習難度を計測する,新しいバイリンガル相互情報(BMI)に基づく適応目的を提案する。
WMT14英語-ドイツ語とWMT19中国語-英語による実験結果は、Transformerベースラインと従来のトークンレベルの適応トレーニングアプローチと比較して、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2021-05-26T12:54:24Z) - Conditioned Text Generation with Transfer for Closed-Domain Dialogue
Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。
クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文 参考訳(メタデータ) (2020-11-03T14:06:10Z) - Dynamic Context Selection for Document-level Neural Machine Translation
via Reinforcement Learning [55.18886832219127]
文書レベルの翻訳における動的コンテキストの選択に有効な手法を提案する。
動的文脈文の選択と活用を促進するために,新しい報酬を提案する。
実験により,提案手法は異なるソース文に対して適応的な文脈文を選択することができることが示された。
論文 参考訳(メタデータ) (2020-10-09T01:05:32Z) - Robust Neural Machine Translation: Modeling Orthographic and
Interpunctual Variation [3.3194866396158]
そこで本研究では,10種類の逆例を生成するための簡易な生成ノイズモデルを提案する。
ノイズの多いデータでテストすると、敵の例を使って訓練されたシステムは、クリーンなデータを翻訳するのと同様に、ほぼ同等に機能することを示す。
論文 参考訳(メタデータ) (2020-09-11T14:12:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。