論文の概要: RAPO: An Adaptive Ranking Paradigm for Bilingual Lexicon Induction
- arxiv url: http://arxiv.org/abs/2210.09926v1
- Date: Tue, 18 Oct 2022 15:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-10-19 13:02:26.168010
- Title: RAPO: An Adaptive Ranking Paradigm for Bilingual Lexicon Induction
- Title(参考訳): RAPO:バイリンガル語彙誘導のための適応的ランク付けパラダイム
- Authors: Zhoujin Tian, Chaozhuo Li, Shuo Ren, Zhiqiang Zuo, Zengxuan Wen,
Xinyue Hu, Xiao Han, Haizhen Huang, Denvy Deng, Qi Zhang, Xing Xie
- Abstract要約: 語彙誘導は、独立に訓練された単語を2つの言語に埋め込むことで、単語翻訳を誘導する。
単語ごとのパーソナライズされたマッピング関数を学習するためのランキング指向誘導モデルRAPOを提案する。
RAPOは、単一の単語の特徴と言語間同型を同時に持つメリットを享受することができる。
- 参考スコア(独自算出の注目度): 25.19579637815882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bilingual lexicon induction induces the word translations by aligning
independently trained word embeddings in two languages. Existing approaches
generally focus on minimizing the distances between words in the aligned pairs,
while suffering from low discriminative capability to distinguish the relative
orders between positive and negative candidates. In addition, the mapping
function is globally shared by all words, whose performance might be hindered
by the deviations in the distributions of different languages. In this work, we
propose a novel ranking-oriented induction model RAPO to learn personalized
mapping function for each word. RAPO is capable of enjoying the merits from the
unique characteristics of a single word and the cross-language isomorphism
simultaneously. Extensive experimental results on public datasets including
both rich-resource and low-resource languages demonstrate the superiority of
our proposal. Our code is publicly available in
\url{https://github.com/Jlfj345wf/RAPO}.
- Abstract(参考訳): バイリンガル語彙誘導は、独立に訓練された単語を2つの言語に埋め込むことで単語翻訳を誘導する。
既存のアプローチでは、正の候補と負の候補の相対的な順序を区別する識別能力が低い一方で、一致したペア内の単語間の距離を最小化することに重点を置いている。
さらに、マッピング関数は全単語でグローバルに共有され、その性能は異なる言語の分布の偏差によって妨げられる可能性がある。
本研究では,単語ごとのパーソナライズされたマッピング関数を学習するためのランキング指向誘導モデルRAPOを提案する。
RAPOは単一の単語の特徴と言語間同型を同時に持つメリットを享受することができる。
リッチリソース言語とローリソース言語の両方を含む公開データセットの広範な実験結果から,提案手法が優れていることが示された。
我々のコードは \url{https://github.com/Jlfj345wf/RAPO} で公開されている。
関連論文リスト
- Robust Unsupervised Cross-Lingual Word Embedding using Domain Flow
Interpolation [48.32604585839687]
従来の敵対的アプローチは、並列データ無しに言語間単語埋め込みを誘導する有望な結果を示している。
そこで本研究では,滑らかなブリッジングのための中間空間列を提案する。
論文 参考訳(メタデータ) (2022-10-07T04:37:47Z) - Word Embedding Transformation for Robust Unsupervised Bilingual Lexicon
Induction [21.782189001319935]
2つの言語の埋め込みの同型性を高めるための変換に基づく手法を提案する。
我々の手法は最先端の手法と比較して、競争力や優れた性能を達成することができる。
論文 参考訳(メタデータ) (2021-05-26T02:09:58Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - A Generalized Constraint Approach to Bilingual Dictionary Induction for
Low-Resource Language Families [1.0312968200748118]
密接に関連する言語に対する制約に基づくバイリンガル語彙帰納法を提案する。
我々はコグネート同義語を多対多の翻訳対を得るために同定する。
論文 参考訳(メタデータ) (2020-10-05T23:41:04Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - On the Language Neutrality of Pre-trained Multilingual Representations [70.93503607755055]
語彙意味論に関して,多言語文脈埋め込みの言語中立性を直接的に検討する。
その結果、文脈埋め込みは言語ニュートラルであり、概して静的な単語型埋め込みよりも情報的であることがわかった。
本稿では,言語識別における最先端の精度に到達し,並列文の単語アライメントのための統計的手法の性能を一致させる方法について述べる。
論文 参考訳(メタデータ) (2020-04-09T19:50:32Z) - Refinement of Unsupervised Cross-Lingual Word Embeddings [2.4366811507669124]
言語間の単語埋め込みは、高リソース言語と低リソース言語のギャップを埋めることを目的としています。
教師なしバイリンガル単語埋め込みのアライメントを改良する自己教師付き手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T10:39:53Z) - On the Importance of Word Order Information in Cross-lingual Sequence
Labeling [80.65425412067464]
ソース言語の単語順に適合する言語間モデルでは、ターゲット言語を処理できない可能性がある。
本研究では,ソース言語の単語順序に敏感なモデルを作成することで,対象言語の適応性能が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2020-01-30T03:35:44Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。