論文の概要: GARI: Graph Attention for Relative Isomorphism of Arabic Word Embeddings
- arxiv url: http://arxiv.org/abs/2310.13068v1
- Date: Thu, 19 Oct 2023 18:08:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 01:45:44.186267
- Title: GARI: Graph Attention for Relative Isomorphism of Arabic Word Embeddings
- Title(参考訳): gari: アラビア語単語埋め込みの相対同型に対するグラフ注意
- Authors: Muhammad Asif Ali, Maha Alshmrani, Jianbin Qin, Yan Hu, Di Wang
- Abstract要約: 語彙誘導(BLI)はNLPの中核的な問題であり、個々の埋め込み空間の相対同型に依存する。
異なる埋め込み空間の相対同型を制御しようとする既存の試みは、意味論的に関連する単語の影響を組み込むことができない。
本稿では,分散学習目標とグラフアテンションネットワークによって導かれる多重同型損失を組み合わせたGARIを提案する。
- 参考スコア(独自算出の注目度): 10.054788741823627
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bilingual Lexical Induction (BLI) is a core challenge in NLP, it relies on
the relative isomorphism of individual embedding spaces. Existing attempts
aimed at controlling the relative isomorphism of different embedding spaces
fail to incorporate the impact of semantically related words in the model
training objective. To address this, we propose GARI that combines the
distributional training objectives with multiple isomorphism losses guided by
the graph attention network. GARI considers the impact of semantical variations
of words in order to define the relative isomorphism of the embedding spaces.
Experimental evaluation using the Arabic language data set shows that GARI
outperforms the existing research by improving the average P@1 by a relative
score of up to 40.95% and 76.80% for in-domain and domain mismatch settings
respectively. We release the codes for GARI at
https://github.com/asif6827/GARI.
- Abstract(参考訳): バイリンガル語彙誘導(BLI)は、個々の埋め込み空間の相対同型に依存するNLPのコアチャレンジである。
異なる埋め込み空間の相対同型を制御しようとする既存の試みは、モデルトレーニングの目的に意味的に関連する単語の影響を取り入れることができない。
そこで本研究では,分散学習目標とグラフアテンションネットワークによって導かれる複数の同型損失を組み合わせたGARIを提案する。
GARIは、埋め込み空間の相対同型を定義するために、単語の意味的バリエーションの影響を考慮する。
アラビア語のデータセットを用いた実験的評価により、ガーリは平均p@1を40.95%、領域内ミスマッチ設定を76.80%改善し、既存の研究を上回っていることが示されている。
GARIのコードはhttps://github.com/asif6827/GARIで公開しています。
関連論文リスト
- Homonym Sense Disambiguation in the Georgian Language [49.1574468325115]
本研究は,ジョージア語における単語センス曖昧化(WSD)課題に対する新しいアプローチを提案する。
これは、ジョージアのCommon Crawls corpusをフィルタリングすることによって形成されたデータセットに基づいて、事前訓練されたLarge Language Model(LLM)の教師付き微調整に基づいている。
論文 参考訳(メタデータ) (2024-04-24T21:48:43Z) - GRI: Graph-based Relative Isomorphism of Word Embedding Spaces [10.984134369344117]
単言語埋め込み空間を用いた二言語辞書の自動構築は機械翻訳における中核的な課題である。
異なる空間の相対同型性を制御することを目的とした既存の試みは、訓練対象に意味的関連語の影響を組み込むことができない。
本稿では,分布学習目的と注意グラフの畳み込みを組み合わせたGRIを提案し,意味的類似語の影響を全会一致で検討する。
論文 参考訳(メタデータ) (2023-10-18T22:10:47Z) - Advancing Incremental Few-shot Semantic Segmentation via Semantic-guided
Relation Alignment and Adaptation [98.51938442785179]
増分的な数ショットセマンティックセマンティックセマンティクスは、セマンティクスセマンティクスモデルを新しいクラスに漸進的に拡張することを目的としている。
このタスクは、データ不均衡のため、ベースクラスと新しいクラスの間で深刻な意味認識の問題に直面します。
本稿では,従来の意味情報のガイダンスを完全に考慮した意味誘導型関係調整適応法を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:40:52Z) - RAPO: An Adaptive Ranking Paradigm for Bilingual Lexicon Induction [25.19579637815882]
語彙誘導は、独立に訓練された単語を2つの言語に埋め込むことで、単語翻訳を誘導する。
単語ごとのパーソナライズされたマッピング関数を学習するためのランキング指向誘導モデルRAPOを提案する。
RAPOは、単一の単語の特徴と言語間同型を同時に持つメリットを享受することができる。
論文 参考訳(メタデータ) (2022-10-18T15:11:45Z) - IsoVec: Controlling the Relative Isomorphism of Word Embedding Spaces [24.256732557154486]
単語埋め込み学習の結果、基礎となる空間が非同型となるという、欠陥のある言語間マッピングの根本原因に対処する。
我々は、Skip-gram損失関数に直接同型のグローバル測度を組み込み、訓練された単語埋め込み空間の相対同型を増大させることに成功した。
論文 参考訳(メタデータ) (2022-10-11T02:29:34Z) - Graph Adaptive Semantic Transfer for Cross-domain Sentiment
Classification [68.06496970320595]
クロスドメイン感情分類(CDSC)は、ソースドメインから学んだ伝達可能なセマンティクスを使用して、ラベルなしのターゲットドメインにおけるレビューの感情を予測することを目的としている。
本稿では、単語列と構文グラフの両方からドメイン不変セマンティクスを学習できる適応型構文グラフ埋め込み法であるグラフ適応意味伝達(GAST)モデルを提案する。
論文 参考訳(メタデータ) (2022-05-18T07:47:01Z) - A Differentiable Relaxation of Graph Segmentation and Alignment for AMR
Parsing [75.36126971685034]
我々は、アライメントとセグメンテーションをモデルの潜在変数として扱い、エンドツーエンドのトレーニングの一部としてそれらを誘導する。
また,AMRの個々の構造を扱うために手作りされたLyu2018AMRPAのセグメンテーションルールに依存するモデルにもアプローチした。
論文 参考訳(メタデータ) (2020-10-23T21:22:50Z) - Simultaneous Semantic Alignment Network for Heterogeneous Domain
Adaptation [67.37606333193357]
本稿では,カテゴリ間の相関を同時に利用し,各カテゴリ毎のセントロイドを整列させるために,aSimultaneous Semantic Alignment Network (SSAN)を提案する。
対象の擬似ラベルを利用することで、各カテゴリの特徴表現を整列させるために、ロバストな三重項中心のアライメント機構を明示的に適用する。
テキスト・ツー・イメージ、画像・画像・テキスト・ツー・テキストにわたる様々なHDAタスクの実験は、最先端のHDA手法に対するSSANの優位性を検証することに成功した。
論文 参考訳(メタデータ) (2020-08-04T16:20:37Z) - The Secret is in the Spectra: Predicting Cross-lingual Task Performance
with Spectral Similarity Measures [83.53361353172261]
本稿では,モノリンガル埋め込み空間の類似性とタスク性能の相関性に着目した大規模研究を行う。
2つの埋め込み空間間のいくつかの同型測度を導入し、それぞれのスペクトルの関連統計に基づく。
このようなスペクトル同型尺度から得られた言語類似度スコアは、異なる言語間タスクで観測された性能と強く関連していることを実証的に示す。
論文 参考訳(メタデータ) (2020-01-30T00:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。