論文の概要: Robust Unsupervised Cross-Lingual Word Embedding using Domain Flow
Interpolation
- arxiv url: http://arxiv.org/abs/2210.03319v1
- Date: Fri, 7 Oct 2022 04:37:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 13:51:06.649306
- Title: Robust Unsupervised Cross-Lingual Word Embedding using Domain Flow
Interpolation
- Title(参考訳): ドメインフロー補間を用いたロバスト教師なし言語間単語埋め込み
- Authors: Liping Tang, Zhen Li, Zhiquan Luo, Helen Meng
- Abstract要約: 従来の敵対的アプローチは、並列データ無しに言語間単語埋め込みを誘導する有望な結果を示している。
そこで本研究では,滑らかなブリッジングのための中間空間列を提案する。
- 参考スコア(独自算出の注目度): 48.32604585839687
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates an unsupervised approach towards deriving a
universal, cross-lingual word embedding space, where words with similar
semantics from different languages are close to one another. Previous
adversarial approaches have shown promising results in inducing cross-lingual
word embedding without parallel data. However, the training stage shows
instability for distant language pairs. Instead of mapping the source language
space directly to the target language space, we propose to make use of a
sequence of intermediate spaces for smooth bridging. Each intermediate space
may be conceived as a pseudo-language space and is introduced via simple linear
interpolation. This approach is modeled after domain flow in computer vision,
but with a modified objective function. Experiments on intrinsic Bilingual
Dictionary Induction tasks show that the proposed approach can improve the
robustness of adversarial models with comparable and even better precision.
Further experiments on the downstream task of Cross-Lingual Natural Language
Inference show that the proposed model achieves significant performance
improvement for distant language pairs in downstream tasks compared to
state-of-the-art adversarial and non-adversarial models.
- Abstract(参考訳): 本稿では、異なる言語からの類似意味を持つ単語が互いに近い普遍的な言語間単語埋め込み空間を導出するための教師なしのアプローチについて検討する。
従来の敵対的アプローチは、並列データ無しに言語間単語埋め込みを誘導する有望な結果を示している。
しかし、訓練段階は遠い言語対の不安定さを示す。
本研究では,ソース言語空間を直接対象言語空間にマッピングする代わりに,スムーズなブリッジングのための中間空間の列を活用することを提案する。
各中間空間は擬言語空間として考え出され、単純な線形補間によって導入される。
このアプローチはコンピュータビジョンにおけるドメインフローをモデル化するが、目的関数を修正したものである。
固有二言語辞書誘導タスクの実験により, 提案手法は, 対向モデルの頑健性を同等かつ精度良く向上させることができることを示した。
言語横断自然言語推論の下流課題に関するさらなる実験により,提案モデルが下流課題における遠隔言語対の性能向上を,最先端および非敵対モデルと比較して達成していることが示された。
関連論文リスト
- Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing [68.47787275021567]
言語間のセマンティックパーシングは、高いソース言語(例えば英語)から少ないトレーニングデータを持つ低リソース言語へのパーシング能力を伝達する。
そこで本稿では,最適輸送を用いた係り受け変数間の言語間相違を明示的に最小化することで,言語間セマンティック解析のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T04:52:31Z) - VECO 2.0: Cross-lingual Language Model Pre-training with
Multi-granularity Contrastive Learning [56.47303426167584]
複数粒度アライメントを持つコントラスト学習に基づく言語間事前学習モデルVECO2.0を提案する。
具体的には、シーケンス・ツー・シーケンスアライメントが誘導され、並列対の類似性を最大化し、非並列対を最小化する。
トークン・ツー・トークンのアライメントは、シソーラス辞書を介して発掘された同義トークンと、バイリンガルな例の他の未使用トークンとのギャップを埋めるために統合される。
論文 参考訳(メタデータ) (2023-04-17T12:23:41Z) - Cross-Align: Modeling Deep Cross-lingual Interactions for Word Alignment [63.0407314271459]
提案したCross-Alignは、5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成する。
実験の結果,提案したCross-Alignは5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成することがわかった。
論文 参考訳(メタデータ) (2022-10-09T02:24:35Z) - Unsupervised Alignment of Distributional Word Embeddings [0.0]
クロスドメインアライメントは、機械翻訳から伝達学習までのタスクにおいて重要な役割を果たす。
提案手法は,複数の言語対をまたいだバイリンガル語彙誘導タスクにおいて,優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-03-09T16:39:06Z) - Refinement of Unsupervised Cross-Lingual Word Embeddings [2.4366811507669124]
言語間の単語埋め込みは、高リソース言語と低リソース言語のギャップを埋めることを目的としています。
教師なしバイリンガル単語埋め込みのアライメントを改良する自己教師付き手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T10:39:53Z) - On the Importance of Word Order Information in Cross-lingual Sequence
Labeling [80.65425412067464]
ソース言語の単語順に適合する言語間モデルでは、ターゲット言語を処理できない可能性がある。
本研究では,ソース言語の単語順序に敏感なモデルを作成することで,対象言語の適応性能が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2020-01-30T03:35:44Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。