論文の概要: GRI: Graph-based Relative Isomorphism of Word Embedding Spaces
- arxiv url: http://arxiv.org/abs/2310.12360v1
- Date: Wed, 18 Oct 2023 22:10:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 17:35:01.119545
- Title: GRI: Graph-based Relative Isomorphism of Word Embedding Spaces
- Title(参考訳): GRI:単語埋め込み空間のグラフベース相対同型
- Authors: Muhammad Asif Ali, Yan Hu, Jianbin Qin, Di Wang
- Abstract要約: 単言語埋め込み空間を用いた二言語辞書の自動構築は機械翻訳における中核的な課題である。
異なる空間の相対同型性を制御することを目的とした既存の試みは、訓練対象に意味的関連語の影響を組み込むことができない。
本稿では,分布学習目的と注意グラフの畳み込みを組み合わせたGRIを提案し,意味的類似語の影響を全会一致で検討する。
- 参考スコア(独自算出の注目度): 10.984134369344117
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated construction of bilingual dictionaries using monolingual embedding
spaces is a core challenge in machine translation. The end performance of these
dictionaries relies upon the geometric similarity of individual spaces, i.e.,
their degree of isomorphism. Existing attempts aimed at controlling the
relative isomorphism of different spaces fail to incorporate the impact of
semantically related words in the training objective. To address this, we
propose GRI that combines the distributional training objectives with attentive
graph convolutions to unanimously consider the impact of semantically similar
words required to define/compute the relative isomorphism of multiple spaces.
Experimental evaluation shows that GRI outperforms the existing research by
improving the average P@1 by a relative score of up to 63.6%. We release the
codes for GRI at https://github.com/asif6827/GRI.
- Abstract(参考訳): 単言語埋め込み空間を用いたバイリンガル辞書の自動構築は機械翻訳の重要な課題である。
これらの辞書の終わりのパフォーマンスは、個々の空間の幾何学的類似性、すなわちそれらの同型度に依存する。
異なる空間の相対同型を制御しようとする既存の試みは、訓練対象に意味的関連語の影響を組み込むことができない。
そこで本研究では,分布的学習目標と注意グラフ畳み込みを組み合わせることで,複数空間の相対同型を定義する/計算に必要な意味論的類似語の影響を満場一致で検討する。
実験により、GRIは、P@1の平均スコアを63.6%まで改善することで、既存の研究より優れていることが示された。
GRIのコードはhttps://github.com/asif6827/GRIで公開しています。
関連論文リスト
- Spatial Semantic Recurrent Mining for Referring Image Segmentation [63.34997546393106]
高品質なクロスモーダリティ融合を実現するために,Stextsuperscript2RMを提案する。
これは、言語特徴の分散、空間的意味的再帰的分離、パーセマンティック・セマンティック・バランシングという三部作の作業戦略に従う。
提案手法は他の最先端アルゴリズムに対して好適に機能する。
論文 参考訳(メタデータ) (2024-05-15T00:17:48Z) - Homonym Sense Disambiguation in the Georgian Language [49.1574468325115]
本研究は,ジョージア語における単語センス曖昧化(WSD)課題に対する新しいアプローチを提案する。
これは、ジョージアのCommon Crawls corpusをフィルタリングすることによって形成されたデータセットに基づいて、事前訓練されたLarge Language Model(LLM)の教師付き微調整に基づいている。
論文 参考訳(メタデータ) (2024-04-24T21:48:43Z) - GARI: Graph Attention for Relative Isomorphism of Arabic Word Embeddings [10.054788741823627]
語彙誘導(BLI)はNLPの中核的な問題であり、個々の埋め込み空間の相対同型に依存する。
異なる埋め込み空間の相対同型を制御しようとする既存の試みは、意味論的に関連する単語の影響を組み込むことができない。
本稿では,分散学習目標とグラフアテンションネットワークによって導かれる多重同型損失を組み合わせたGARIを提案する。
論文 参考訳(メタデータ) (2023-10-19T18:08:22Z) - Leveraging multilingual transfer for unsupervised semantic acoustic word
embeddings [23.822788597966646]
音響単語埋め込み(AWEs)は、音声の内容を符号化する音声セグメントの固定次元ベクトル表現である。
本稿ではセマンティックAWEモデリングについて考察する。
AWEがダウンストリームのセマンティッククエリ・バイ・サンプル検索に使用できることを初めて示します。
論文 参考訳(メタデータ) (2023-07-05T07:46:54Z) - IsoVec: Controlling the Relative Isomorphism of Word Embedding Spaces [24.256732557154486]
単語埋め込み学習の結果、基礎となる空間が非同型となるという、欠陥のある言語間マッピングの根本原因に対処する。
我々は、Skip-gram損失関数に直接同型のグローバル測度を組み込み、訓練された単語埋め込み空間の相対同型を増大させることに成功した。
論文 参考訳(メタデータ) (2022-10-11T02:29:34Z) - A Differentiable Relaxation of Graph Segmentation and Alignment for AMR
Parsing [75.36126971685034]
我々は、アライメントとセグメンテーションをモデルの潜在変数として扱い、エンドツーエンドのトレーニングの一部としてそれらを誘導する。
また,AMRの個々の構造を扱うために手作りされたLyu2018AMRPAのセグメンテーションルールに依存するモデルにもアプローチした。
論文 参考訳(メタデータ) (2020-10-23T21:22:50Z) - Joint Semantic Analysis with Document-Level Cross-Task Coherence Rewards [13.753240692520098]
本稿では,共用コア参照解決のためのニューラルネットワークアーキテクチャと,英語のセマンティックロールラベリングについて述べる。
我々は、文書と意味的アノテーション間のグローバルコヒーレンスを促進するために強化学習を使用します。
これにより、異なるドメインからの複数のデータセットにおける両方のタスクが改善される。
論文 参考訳(メタデータ) (2020-10-12T09:36:24Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Simultaneous Semantic Alignment Network for Heterogeneous Domain
Adaptation [67.37606333193357]
本稿では,カテゴリ間の相関を同時に利用し,各カテゴリ毎のセントロイドを整列させるために,aSimultaneous Semantic Alignment Network (SSAN)を提案する。
対象の擬似ラベルを利用することで、各カテゴリの特徴表現を整列させるために、ロバストな三重項中心のアライメント機構を明示的に適用する。
テキスト・ツー・イメージ、画像・画像・テキスト・ツー・テキストにわたる様々なHDAタスクの実験は、最先端のHDA手法に対するSSANの優位性を検証することに成功した。
論文 参考訳(メタデータ) (2020-08-04T16:20:37Z) - Are All Good Word Vector Spaces Isomorphic? [79.04509759167952]
言語ペア間の性能のばらつきは, 類型的差異によるだけでなく, 利用可能なモノリンガル資源の大きさによるところが大きい。
論文 参考訳(メタデータ) (2020-04-08T15:49:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。