論文の概要: Learning Language Specific Sub-network for Multilingual Machine
Translation
- arxiv url: http://arxiv.org/abs/2105.09259v1
- Date: Wed, 19 May 2021 17:08:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 13:50:38.753953
- Title: Learning Language Specific Sub-network for Multilingual Machine
Translation
- Title(参考訳): 多言語機械翻訳のための学習言語固有サブネットワーク
- Authors: Zehui Lin, Liwei Wu, Mingxuan Wang, Lei Li
- Abstract要約: 単一統一多言語MTモデルを共同で訓練するLaSSを提案する。
IWSLTとWMTデータセットの実験では、LaSSは最大1.2BLEUで36言語対のゲインを得る。
LaSSは、30言語対で平均8.3BLEUでゼロショット翻訳を促進する。
- 参考スコア(独自算出の注目度): 15.44119901665185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multilingual neural machine translation aims at learning a single translation
model for multiple languages. These jointly trained models often suffer from
performance degradation on rich-resource language pairs. We attribute this
degeneration to parameter interference. In this paper, we propose LaSS to
jointly train a single unified multilingual MT model. LaSS learns Language
Specific Sub-network (LaSS) for each language pair to counter parameter
interference. Comprehensive experiments on IWSLT and WMT datasets with various
Transformer architectures show that LaSS obtains gains on 36 language pairs by
up to 1.2 BLEU. Besides, LaSS shows its strong generalization performance at
easy extension to new language pairs and zero-shot translation.LaSS boosts
zero-shot translation with an average of 8.3 BLEU on 30 language pairs. Codes
and trained models are available at https://github.com/NLP-Playground/LaSS.
- Abstract(参考訳): 多言語ニューラルマシン翻訳は、複数の言語のための単一の翻訳モデルを学ぶことを目的としている。
これらの共同学習モデルはしばしばリッチリソース言語ペアのパフォーマンス低下に苦しむ。
我々はこの変性をパラメータ干渉とみなす。
本稿では,単一統一多言語MTモデルを共同で学習するためのLaSSを提案する。
LaSSは言語固有のサブネットワーク(LaSS)を学習し、パラメータ干渉に対処する。
様々なTransformerアーキテクチャによるIWSLTとWMTデータセットの総合的な実験により、LaSSは最大1.2BLEUで36言語対のゲインを得ることが示された。
さらに、LaSSは、新しい言語ペアへの容易な拡張とゼロショット翻訳で強力な一般化性能を示し、30言語ペアで平均8.3BLEUでゼロショット翻訳を促進する。
コードとトレーニングされたモデルはhttps://github.com/NLP-Playground/LaSSで公開されている。
関連論文リスト
- Efficient Adapter Finetuning for Tail Languages in Streaming
Multilingual ASR [44.949146169903074]
不均一な性質と異なる言語の不均衡なデータが、性能劣化を引き起こす可能性がある。
提案手法は,単語誤り率を平均12.2%,ローカライズで最大37.5%削減する。
論文 参考訳(メタデータ) (2024-01-17T06:01:16Z) - Parameter-Efficient Cross-lingual Transfer of Vision and Language Models
via Translation-based Alignment [31.885608173448368]
CLIPのような事前訓練された視覚と言語モデルは、画像とテキストを英語のテキストに焦点を合わせることに顕著な成功を収めた。
異なる言語間のパフォーマンスの格差は、不均一なリソース可用性のために観測されている。
翻訳に基づくアライメント手法を用いて,多言語差を緩和するパラメータ効率のよい多言語間移動学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-02T14:09:02Z) - Parameter-Efficient Neural Reranking for Cross-Lingual and Multilingual
Retrieval [66.69799641522133]
最先端のニューラルランカーは、お腹が空いていることで悪名高い。
現在のアプローチでは、英語データに基づいて訓練されたローダを、多言語エンコーダを用いて他の言語や言語間設定に転送するのが一般的である。
本研究では,Sparse Fine-Tuning Masks (SFTMs) とAdapters (Adapters) の2つのパラメータ効率のアプローチにより,より軽量で効果的なゼロショット転送が可能となることを示す。
論文 参考訳(メタデータ) (2022-04-05T15:44:27Z) - Continual Learning in Multilingual NMT via Language-Specific Embeddings [92.91823064720232]
共有語彙を小さな言語固有の語彙に置き換え、新しい言語の並列データに新しい埋め込みを微調整する。
元のモデルのパラメータは変更されていないため、初期言語の性能は劣化しない。
論文 参考訳(メタデータ) (2021-10-20T10:38:57Z) - Enabling Zero-shot Multilingual Spoken Language Translation with
Language-Specific Encoders and Decoders [5.050654565113709]
Spoken Language Translationへの現在のエンドツーエンドアプローチは、限られたトレーニングリソースに依存しています。
提案手法は,言語固有のエンコーダデコーダに基づくMultiNMTアーキテクチャを多言語SLTのタスクに拡張する。
論文 参考訳(メタデータ) (2020-11-02T16:31:14Z) - Cross-lingual Machine Reading Comprehension with Language Branch
Knowledge Distillation [105.41167108465085]
言語間機械読解(CLMRC)は、ローソース言語に大規模なデータセットがないため、依然として難しい問題である。
本稿では,Language Branch Machine Reading (LBMRC) という新しい拡張手法を提案する。
LBMRCは、個々の言語に精通したMultiple Machine Read comprehension (MRC)モデルを訓練する。
複数の言語分岐モデルから全ての対象言語に対する単一モデルへのアマルガメート知識の多言語蒸留アプローチを考案する。
論文 参考訳(メタデータ) (2020-10-27T13:12:17Z) - Pre-training Multilingual Neural Machine Translation by Leveraging
Alignment Information [72.2412707779571]
mRASPは、汎用多言語ニューラルマシン翻訳モデルを事前訓練するためのアプローチである。
我々は,低,中,豊かな資源を含む多種多様な環境における42の翻訳方向の実験を行い,エキゾチックな言語対への変換を行った。
論文 参考訳(メタデータ) (2020-10-07T03:57:54Z) - Improving Massively Multilingual Neural Machine Translation and
Zero-Shot Translation [81.7786241489002]
ニューラルネットワーク翻訳(NMT)の多言語モデルは理論的には魅力的であるが、しばしばバイリンガルモデルに劣る。
我々は,多言語NMTが言語ペアをサポートするためにより強力なモデリング能力を必要とすることを論じる。
未知のトレーニング言語ペアの翻訳を強制するために,ランダムなオンライン翻訳を提案する。
論文 参考訳(メタデータ) (2020-04-24T17:21:32Z) - Knowledge Distillation for Multilingual Unsupervised Neural Machine
Translation [61.88012735215636]
unsupervised neural machine translation (UNMT) は、最近、いくつかの言語対に対して顕著な結果を得た。
UNMTは単一の言語ペア間でのみ翻訳することができ、同時に複数の言語ペアに対して翻訳結果を生成することはできない。
本稿では,1つのエンコーダと1つのデコーダを用いて13言語間を翻訳する簡単な手法を実証的に紹介する。
論文 参考訳(メタデータ) (2020-04-21T17:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。