論文の概要: Geometry-aware Domain Adaptation for Unsupervised Alignment of Word
Embeddings
- arxiv url: http://arxiv.org/abs/2004.08243v2
- Date: Mon, 20 Apr 2020 14:48:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:15:58.062936
- Title: Geometry-aware Domain Adaptation for Unsupervised Alignment of Word
Embeddings
- Title(参考訳): 単語埋め込みの教師なしアライメントに対する幾何学的ドメイン適応
- Authors: Pratik Jawanpuria, Mayank Meghwanshi, Bamdev Mishra
- Abstract要約: そこで本研究では,対象言語間の単語埋め込みの教師なしアライメントを学習するための,新しい多様体に基づく幾何学的手法を提案する。
本手法は、多様体の二重行列上の領域適応問題としてアライメント学習問題を定式化する。
提案手法は,複数の言語対にまたがる勾配誘導課題に基づく,最先端の最適輸送手法よりも優れている。
- 参考スコア(独自算出の注目度): 15.963615360741356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel manifold based geometric approach for learning
unsupervised alignment of word embeddings between the source and the target
languages. Our approach formulates the alignment learning problem as a domain
adaptation problem over the manifold of doubly stochastic matrices. This
viewpoint arises from the aim to align the second order information of the two
language spaces. The rich geometry of the doubly stochastic manifold allows to
employ efficient Riemannian conjugate gradient algorithm for the proposed
formulation. Empirically, the proposed approach outperforms state-of-the-art
optimal transport based approach on the bilingual lexicon induction task across
several language pairs. The performance improvement is more significant for
distant language pairs.
- Abstract(参考訳): 本稿では,ソース言語と対象言語間の単語埋め込みの教師なしアライメントを学ぶための,新しい多様体に基づく幾何学的手法を提案する。
本手法は二重確率行列の多様体上の領域適応問題としてアライメント学習問題を定式化する。
この視点は、2つの言語空間の2階情報を整列する目的から生じる。
二重確率多様体のリッチな幾何学は、提案された定式化に対して効率的なリーマン共役勾配アルゴリズムを用いることができる。
提案手法は,複数の言語対にまたがるバイリンガル語彙誘導課題に基づく,最先端の最適輸送手法よりも優れている。
パフォーマンス改善は、遠い言語ペアにとってより重要である。
関連論文リスト
- Taxonomy Adaptive Cross-Domain Adaptation in Medical Imaging via
Optimization Trajectory Distillation [73.83178465971552]
自動医用画像解析の成功は、大規模かつ専門家による注釈付きトレーニングセットに依存する。
非教師なしドメイン適応(UDA)はラベル付きデータ収集の負担を軽減するための有望なアプローチである。
本稿では,2つの技術的課題に新しい視点から対処する統一的手法である最適化トラジェクトリ蒸留を提案する。
論文 参考訳(メタデータ) (2023-07-27T08:58:05Z) - Cross-Align: Modeling Deep Cross-lingual Interactions for Word Alignment [63.0407314271459]
提案したCross-Alignは、5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成する。
実験の結果,提案したCross-Alignは5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成することがわかった。
論文 参考訳(メタデータ) (2022-10-09T02:24:35Z) - Robust Unsupervised Cross-Lingual Word Embedding using Domain Flow
Interpolation [48.32604585839687]
従来の敵対的アプローチは、並列データ無しに言語間単語埋め込みを誘導する有望な結果を示している。
そこで本研究では,滑らかなブリッジングのための中間空間列を提案する。
論文 参考訳(メタデータ) (2022-10-07T04:37:47Z) - Unsupervised Alignment of Distributional Word Embeddings [0.0]
クロスドメインアライメントは、機械翻訳から伝達学習までのタスクにおいて重要な役割を果たす。
提案手法は,複数の言語対をまたいだバイリンガル語彙誘導タスクにおいて,優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-03-09T16:39:06Z) - Using Optimal Transport as Alignment Objective for fine-tuning
Multilingual Contextualized Embeddings [7.026476782041066]
我々は,マルチリンガルな文脈化表現を改善するために,微調整時のアライメント目的として最適輸送(OT)を提案する。
このアプローチでは、微調整の前に単語アライメントペアを必要とせず、教師なしの方法で文脈内の単語アライメントを学習する。
論文 参考訳(メタデータ) (2021-10-06T16:13:45Z) - Unsupervised Word Translation Pairing using Refinement based Point Set
Registration [8.568050813210823]
単語埋め込みの言語間アライメントは、言語間の知識伝達において重要な役割を果たす。
現在の教師なしのアプローチは、言語にまたがる単語埋め込み空間の幾何学的構造における類似性に依存している。
本稿では,バイリンガル単語の共有ベクトル空間への埋め込みを教師なしでマッピングするBioSpereを提案する。
論文 参考訳(メタデータ) (2020-11-26T09:51:29Z) - Unsupervised Cross-lingual Adaptation for Sequence Tagging and Beyond [58.80417796087894]
多言語事前訓練言語モデル(mPTLM)による言語間適応は、主にゼロショットアプローチと翻訳に基づくアプローチの2行からなる。
本稿では、ゼロショットアプローチと翻訳に基づくアプローチを統合し、適応性能を向上させるための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-23T13:47:01Z) - RatE: Relation-Adaptive Translating Embedding for Knowledge Graph
Completion [51.64061146389754]
複素空間における新たな重み付き積の上に構築された関係適応変換関数を提案する。
次に、関係適応型翻訳埋め込み(RatE)アプローチを示し、各グラフを3倍にスコアする。
論文 参考訳(メタデータ) (2020-10-10T01:30:30Z) - Filtered Inner Product Projection for Crosslingual Embedding Alignment [28.72288652451881]
フィルタ内積投影(FIPP)は、埋め込みを共通表現空間にマッピングする手法である。
FIPPは、ソースとターゲットの埋め込みが異なる次元である場合でも適用可能である。
提案手法は,MUSEデータセット上の既存の手法よりも,様々な言語ペアに対して優れていることを示す。
論文 参考訳(メタデータ) (2020-06-05T19:53:30Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。