論文の概要: Unsupervised Multilingual Alignment using Wasserstein Barycenter
- arxiv url: http://arxiv.org/abs/2002.00743v2
- Date: Tue, 28 Jul 2020 23:42:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 01:57:49.017067
- Title: Unsupervised Multilingual Alignment using Wasserstein Barycenter
- Title(参考訳): Wasserstein Barycenter を用いた教師なし多言語アライメント
- Authors: Xin Lian, Kshitij Jain, Jakub Truszkowski, Pascal Poupart, and
Yaoliang Yu
- Abstract要約: 並列データを用いずに複数の言語間で単語間翻訳を行う問題について検討する。
我々は、ワッサーシュタイン・バリセンタをより情報的な「意味」言語として使うことを提案する。
- 参考スコア(独自算出の注目度): 29.209839093195914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study unsupervised multilingual alignment, the problem of finding
word-to-word translations between multiple languages without using any parallel
data. One popular strategy is to reduce multilingual alignment to the much
simplified bilingual setting, by picking one of the input languages as the
pivot language that we transit through. However, it is well-known that
transiting through a poorly chosen pivot language (such as English) may
severely degrade the translation quality, since the assumed transitive
relations among all pairs of languages may not be enforced in the training
process. Instead of going through a rather arbitrarily chosen pivot language,
we propose to use the Wasserstein barycenter as a more informative "mean"
language: it encapsulates information from all languages and minimizes all
pairwise transportation costs. We evaluate our method on standard benchmarks
and demonstrate state-of-the-art performances.
- Abstract(参考訳): 並列データを用いずに複数の言語間で単語間翻訳を行う問題である,教師なし多言語アライメントについて検討する。
一般的な戦略の1つは、入力言語のうちの1つを通過する重要な言語として選択することで、より単純化されたバイリンガル設定に対する多言語アライメントを減らすことである。
しかし、不適切な選択されたピボット言語(英語など)を通すと翻訳品質が著しく低下する可能性があることはよく知られている。
任意に選択されたピボット言語を通す代わりに、wasserstein barycenterをより有意義な"平均"言語として使うことを提案している。
本手法を標準ベンチマークで評価し,最新性能を示す。
関連論文リスト
- Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing [68.47787275021567]
言語間のセマンティックパーシングは、高いソース言語(例えば英語)から少ないトレーニングデータを持つ低リソース言語へのパーシング能力を伝達する。
そこで本稿では,最適輸送を用いた係り受け変数間の言語間相違を明示的に最小化することで,言語間セマンティック解析のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T04:52:31Z) - Language-Family Adapters for Low-Resource Multilingual Neural Machine
Translation [129.99918589405675]
自己超越で訓練された大規模多言語モデルは、幅広い自然言語処理タスクにおいて最先端の結果を達成する。
マルチリンガルな微調整は低リソース言語のパフォーマンスを向上させるが、モデル全体を変更する必要があるため、極めて高価である。
言語間移動を容易にするため,mBART-50上で言語ファミリーアダプタを訓練する。
論文 参考訳(メタデータ) (2022-09-30T05:02:42Z) - Adapting to Non-Centered Languages for Zero-shot Multilingual
Translation [12.487990897680422]
我々は,非中心言語に適応して,シンプルで軽量で効果的な言語特化モデリング手法を提案する。
IWSLT17, Europarl, TED Talk, OPUS-100 データセットの Transformer を用いた実験により, 本手法が非中心データ条件に容易に適合できることが判明した。
論文 参考訳(メタデータ) (2022-09-09T06:34:12Z) - Globetrotter: Unsupervised Multilingual Translation from Visual
Alignment [24.44204156935044]
視覚的モダリティを用いて複数の言語を整列させるフレームワークを提案する。
言語と画像のクロスモーダルアライメントを推定し,この推定値を用いて言語間表現の学習を指導する。
私たちの言語表現は、1つのステージを持つ1つのモデルで共同で訓練されます。
論文 参考訳(メタデータ) (2020-12-08T18:50:40Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。
提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文 参考訳(メタデータ) (2020-05-01T12:22:33Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - On the Language Neutrality of Pre-trained Multilingual Representations [70.93503607755055]
語彙意味論に関して,多言語文脈埋め込みの言語中立性を直接的に検討する。
その結果、文脈埋め込みは言語ニュートラルであり、概して静的な単語型埋め込みよりも情報的であることがわかった。
本稿では,言語識別における最先端の精度に到達し,並列文の単語アライメントのための統計的手法の性能を一致させる方法について述べる。
論文 参考訳(メタデータ) (2020-04-09T19:50:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。