論文の概要: A Simple Baseline to Semi-Supervised Domain Adaptation for Machine
Translation
- arxiv url: http://arxiv.org/abs/2001.08140v2
- Date: Sat, 6 Jun 2020 02:45:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 17:53:31.372886
- Title: A Simple Baseline to Semi-Supervised Domain Adaptation for Machine
Translation
- Title(参考訳): 機械翻訳のための半教師付きドメイン適応のための簡易ベースライン
- Authors: Di Jin, Zhijing Jin, Joey Tianyi Zhou, Peter Szolovits
- Abstract要約: State-of-the-art Neural Machine Translation (NMT)システムは、データハングリーであり、教師付きデータを持たない新しいドメインではパフォーマンスが良くない。
NMTの半教師付きドメイン適応シナリオに対する単純だが効果のあるアプローチを提案する。
このアプローチは、言語モデリング、バックトランスレーション、教師付き翻訳の3つのトレーニング目標を通じて、TransformerベースのNMTモデルを反復的にトレーニングする。
- 参考スコア(独自算出の注目度): 73.3550140511458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art neural machine translation (NMT) systems are data-hungry and
perform poorly on new domains with no supervised data. As data collection is
expensive and infeasible in many cases, domain adaptation methods are needed.
In this work, we propose a simple but effect approach to the semi-supervised
domain adaptation scenario of NMT, where the aim is to improve the performance
of a translation model on the target domain consisting of only non-parallel
data with the help of supervised source domain data. This approach iteratively
trains a Transformer-based NMT model via three training objectives: language
modeling, back-translation, and supervised translation. We evaluate this method
on two adaptation settings: adaptation between specific domains and adaptation
from a general domain to specific domains, and on two language pairs: German to
English and Romanian to English. With substantial performance improvement
achieved---up to +19.31 BLEU over the strongest baseline, and +47.69 BLEU
improvement over the unadapted model---we present this method as a simple but
tough-to-beat baseline in the field of semi-supervised domain adaptation for
NMT.
- Abstract(参考訳): State-of-the-art Neural Machine Translation (NMT)システムは、データハングリーであり、教師付きデータを持たない新しいドメインではパフォーマンスが悪い。
多くの場合、データ収集は高価で実行不可能であるため、ドメイン適応メソッドが必要です。
そこで本研究では,NMTの半教師付きドメイン適応シナリオに対して,非並列データのみからなる対象ドメイン上での翻訳モデルの性能向上を目的とし,教師付きソースドメインデータの助けを借りて提案する。
このアプローチは、言語モデリング、バック翻訳、教師付き翻訳の3つのトレーニング目標を通じて、TransformerベースのNMTモデルを反復的にトレーニングする。
本手法は、特定のドメイン間の適応と、一般ドメインから特定のドメインへの適応と、ドイツ語から英語、ルーマニア語から英語への2つの言語ペアについて評価する。
最強ベースライン上の+19.31 BLEUと、未適応モデルに対する+47.69 BLEUの大幅な性能向上が達成され、NMTの半教師付きドメイン適応の分野では、この手法は単純だが強靭なベースラインとして提示された。
関連論文リスト
- Non-Parametric Domain Adaptation for End-to-End Speech Translation [72.37869362559212]
E2E-ST(End-to-End Speech Translation)は、エラー伝播の低減、レイテンシの低減、パラメータの削減などにより注目されている。
本稿では,E2E-STシステムのドメイン適応を実現するために,ドメイン固有のテキスト翻訳コーパスを活用する新しい非パラメトリック手法を提案する。
論文 参考訳(メタデータ) (2022-05-23T11:41:02Z) - Non-Parametric Unsupervised Domain Adaptation for Neural Machine
Translation [61.27321597981737]
$k$NN-MTは、トレーニング済みニューラルネットワーク翻訳(NMT)モデルとドメイン固有のトークンレベルである$k$-nearest-neighbor検索を直接組み込むという有望な能力を示している。
対象言語におけるドメイン内単言語文を直接使用して,$k$-nearest-neighbor検索に有効なデータストアを構築する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-14T11:50:01Z) - Domain Adaptation and Multi-Domain Adaptation for Neural Machine
Translation: A Survey [9.645196221785694]
ニューラルマシン翻訳(nmt)モデルのドメイン適応に対するロバストなアプローチに注目した。
特に、システムが複数のドメインから文を翻訳する必要がある場合を検討します。
我々はNMT研究の他の分野に対するドメイン適応とマルチドメイン適応技術の利点を強調した。
論文 参考訳(メタデータ) (2021-04-14T16:21:37Z) - Iterative Domain-Repaired Back-Translation [50.32925322697343]
本稿では,ドメイン内並列コーパスが少ない,あるいは存在しない,低リソースのドメイン固有翻訳に焦点を当てる。
本稿では,合成バイリンガルデータの翻訳を洗練するためのドメイン・リペアモデルを提案する。
提案手法の有効性を示すため,NMTモデルを特定の領域と一般領域から特定の領域に適応させる実験を行った。
論文 参考訳(メタデータ) (2020-10-06T04:38:09Z) - Vocabulary Adaptation for Distant Domain Adaptation in Neural Machine
Translation [14.390932594872233]
語彙のミスマッチにより、ドメイン間のドメイン適応を効果的に行うことはできない。
本稿では,効果的な微調整法である語彙適応法を提案する。
本手法は,En-JaおよびDe-En翻訳における従来の微調整性能を3.86点,3.28点改善する。
論文 参考訳(メタデータ) (2020-04-30T14:27:59Z) - Dynamic Data Selection and Weighting for Iterative Back-Translation [116.14378571769045]
本稿では,反復的バックトランスレーションモデルのためのカリキュラム学習戦略を提案する。
我々は、ドメイン適応、低リソース、高リソースMT設定に関するモデルを評価する。
実験の結果,提案手法は競争基準値よりも最大1.8 BLEU点の改善を達成できた。
論文 参考訳(メタデータ) (2020-04-07T19:49:58Z) - Supervised Domain Adaptation using Graph Embedding [86.3361797111839]
領域適応法は、2つの領域間の分布がシフトし、それを認識しようとすると仮定する。
グラフ埋め込みに基づく汎用フレームワークを提案する。
提案手法が強力なドメイン適応フレームワークにつながることを示す。
論文 参考訳(メタデータ) (2020-03-09T12:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。