論文の概要: First Align, then Predict: Understanding the Cross-Lingual Ability of
Multilingual BERT
- arxiv url: http://arxiv.org/abs/2101.11109v1
- Date: Tue, 26 Jan 2021 22:12:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 01:05:11.661575
- Title: First Align, then Predict: Understanding the Cross-Lingual Ability of
Multilingual BERT
- Title(参考訳): 第一に、そして予測:多言語BERTの言語間能力を理解する
- Authors: Benjamin Muller and Yanai Elazar and Beno\^it Sagot and Djam\'e Seddah
- Abstract要約: 言語間移動は、ある言語への関心のタスクを微調整し、ある言語を個別に評価することから生じる。
多言語bertは,マルチリンガルエンコーダとタスク固有言語非依存予測器の2つのサブネットワークの積み重ねと見なすことができる。
エンコーダは言語間移動に不可欠であり、微調整中はほとんど変化しないが、タスク予測器は転写にほとんど重要ではなく、微調整時に赤くなる。
- 参考スコア(独自算出の注目度): 2.2931318723689276
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Multilingual pretrained language models have demonstrated remarkable
zero-shot cross-lingual transfer capabilities. Such transfer emerges by
fine-tuning on a task of interest in one language and evaluating on a distinct
language, not seen during the fine-tuning. Despite promising results, we still
lack a proper understanding of the source of this transfer. Using a novel layer
ablation technique and analyses of the model's internal representations, we
show that multilingual BERT, a popular multilingual language model, can be
viewed as the stacking of two sub-networks: a multilingual encoder followed by
a task-specific language-agnostic predictor. While the encoder is crucial for
cross-lingual transfer and remains mostly unchanged during fine-tuning, the
task predictor has little importance on the transfer and can be reinitialized
during fine-tuning. We present extensive experiments with three distinct tasks,
seventeen typologically diverse languages and multiple domains to support our
hypothesis.
- Abstract(参考訳): 多言語事前訓練された言語モデルは、目覚ましいゼロショットの言語間移動能力を示した。
このような移行は、1つの言語に興味のあるタスクを微調整し、微調整の間は見えない別の言語で評価することで生じる。
有望な結果にもかかわらず、我々はまだこの転送のソースの適切な理解を欠いています。
新たな層アブレーション手法とモデルの内部表現の解析を用いて,多言語言語モデルであるマルチリンガルbertを,マルチリンガルエンコーダとタスク固有言語非依存予測器の2つのサブネットワークの積み重ねと見なすことができることを示した。
エンコーダは言語間移動に不可欠であり、微調整中はほとんど変化しないが、タスク予測器は転写にほとんど重要性がなく、微調整時に再起動できる。
我々は,3つの異なるタスク,17の類型的多様言語,および仮説を支持する複数のドメインを用いた広範囲な実験を行った。
関連論文リスト
- Analyzing the Evaluation of Cross-Lingual Knowledge Transfer in
Multilingual Language Models [12.662039551306632]
その結果,多言語モデルの高性能化は,実際の言語知識の伝達を必要としない要因が主な原因であることが示唆された。
具体的には、特に低リソース言語において、言語間で転送されたものは、主にデータアーチファクトとバイアスです。
論文 参考訳(メタデータ) (2024-02-03T09:41:52Z) - Analyzing the Mono- and Cross-Lingual Pretraining Dynamics of
Multilingual Language Models [73.11488464916668]
本研究では,多言語事前学習プロセスのダイナミクスについて検討する。
我々は,XLM-Rプレトレーニング全体から抽出したチェックポイントを,一連の言語的タスクを用いて探索する。
分析の結果,より複雑なものよりも低レベルな言語スキルが得られ,早期に高い言語性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-05-24T03:35:00Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - Revisiting the Primacy of English in Zero-shot Cross-lingual Transfer [39.360667403003745]
ゼロショット・クロスランガル・トランスファーは実用的な解決策として浮上している。
人気のあるゼロショットベンチマークによって強化されたように、英語は転送のための主要なソース言語である。
ドイツ語やロシア語のような他の高リソース言語は、より効果的に転送されることがよくあります。
論文 参考訳(メタデータ) (2021-06-30T16:05:57Z) - Syntax-augmented Multilingual BERT for Cross-lingual Transfer [37.99210035238424]
この研究は、言語構文とトレーニングmBERTを明示的に提供することが、言語間転送に役立つことを示している。
実験の結果,mBERTの構文拡張は,一般的なベンチマーク上での言語間移動を改善することがわかった。
論文 参考訳(メタデータ) (2021-06-03T21:12:50Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - Cross-Lingual Transfer in Zero-Shot Cross-Language Entity Linking [19.083300046605252]
言語間リンクの基盤は、複数の言語で言及され、単一の言語知識ベースに言及される。
BERTの多言語化能力は単言語および多言語設定において頑健な性能をもたらすことが判明した。
論文 参考訳(メタデータ) (2020-10-19T20:08:26Z) - From Zero to Hero: On the Limitations of Zero-Shot Cross-Lingual
Transfer with Multilingual Transformers [62.637055980148816]
言語モデリングの目的によって事前訓練された多言語トランスフォーマーは、NLPの事実上のデフォルト転送パラダイムとなっている。
膨大な多言語変換器による言語間変換は,リソースリーンシナリオや遠方言語では著しく効果が低いことを示す。
論文 参考訳(メタデータ) (2020-05-01T22:04:58Z) - A Study of Cross-Lingual Ability and Language-specific Information in
Multilingual BERT [60.9051207862378]
Multilingual BERTは、言語間転送タスクで驚くほどうまく機能します。
データサイズとコンテキストウィンドウサイズは、転送可能性にとって重要な要素です。
多言語BERTの言語間能力を改善するために、計算的に安価だが効果的なアプローチがある。
論文 参考訳(メタデータ) (2020-04-20T11:13:16Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。