論文の概要: Semantic Alignment of Multilingual Knowledge Graphs via Contextualized Vector Projections
- arxiv url: http://arxiv.org/abs/2601.00814v1
- Date: Mon, 22 Dec 2025 11:02:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-11 18:48:17.516033
- Title: Semantic Alignment of Multilingual Knowledge Graphs via Contextualized Vector Projections
- Title(参考訳): 文脈ベクトル投影による多言語知識グラフのセマンティックアライメント
- Authors: Abhishek Kumar,
- Abstract要約: 埋め込みに基づくコサイン類似性マッチングを用いた言語間アライメントシステム
我々は、より優れた埋め込みを生成するために、微調整変換器に基づく多言語モデルを使用する。
我々はOAEI-2022マルチファームトラックについて検討した。
- 参考スコア(独自算出の注目度): 8.709638469928448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper presents our work on cross-lingual ontology alignment system which uses embedding based cosine similarity matching. The ontology entities are made contextually richer by creating descriptions using novel techniques. We use a fine-tuned transformer based multilingual model for generating better embeddings. We use cosine similarity to find positive ontology entities pairs and then apply threshold filtering to retain only highly similar entities. We have evaluated our work on OAEI-2022 multifarm track. We achieve 71% F1 score (78% recall and 65% precision) on the evaluation dataset, 16% increase from best baseline score. This suggests that our proposed alignment pipeline is able to capture the subtle cross-lingual similarities.
- Abstract(参考訳): 本稿では,埋め込みに基づくコサイン類似性マッチングを用いた言語間オントロジーアライメントシステムについて述べる。
オントロジーエンティティは、新しい技術を用いて記述を作成することにより、文脈的にリッチになる。
我々は、より優れた埋め込みを生成するために、微調整変換器に基づく多言語モデルを使用する。
正のオントロジーエンティティペアを見つけるためにコサイン類似性を使用し、その後、閾値フィルタリングを適用して非常に類似したエンティティのみを保持する。
我々はOAEI-2022マルチファームトラックについて検討した。
評価データセットのF1スコアは71%(リコール78%,精度65%)、ベースラインスコアは16%向上した。
これは、提案したアライメントパイプラインが、微妙な言語間類似性を捉えることができることを示唆している。
関連論文リスト
- How Transliterations Improve Crosslingual Alignment [48.929677368744606]
近年の研究では、アライメント目的を用いた多言語事前学習言語モデル(mPLM)が言語横断アライメントを改善することが示されている。
本稿では, 言語間のアライメントを明示的に評価し, 翻訳に基づくアプローチにおける重要な要素を同定し, 性能向上に寄与する。
論文 参考訳(メタデータ) (2024-09-25T20:05:45Z) - LyricSIM: A novel Dataset and Benchmark for Similarity Detection in
Spanish Song LyricS [52.77024349608834]
歌詞中の意味的類似性に合わせた新しいデータセットとベンチマークを提案する。
このデータセットはもともと2775組のスペイン語の歌で構成されており、63のネイティブアノテータによる集合アノテーション実験で注釈付けされました。
論文 参考訳(メタデータ) (2023-06-02T07:48:20Z) - Learnable Pillar-based Re-ranking for Image-Text Retrieval [119.9979224297237]
画像テキスト検索は、モダリティギャップを埋め、意味的類似性に基づいてモダリティコンテンツを検索することを目的としている。
一般的なポストプロセッシング手法であるリグレードは, 単一モダリティ検索タスクにおいて, 隣り合う関係を捕捉する優位性を明らかにしている。
本稿では,画像テキスト検索のための新しい学習可能な柱型リグレードパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-25T04:33:27Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - SemEval-2022 Task 8: Multi-lingual News Article Similarity [0.0]
この研究は、一対のニュース記事の類似性を見つけることを目的としている。
データセットには7つの異なる目的的類似度指標があり、ニュース記事は複数の異なる言語で提供されている。
事前学習した埋め込みモデルに基づいて,ベースライン結果のコサイン類似性を計算し,その上でフィードフォワードニューラルネットワークをトレーニングし,結果を改善する。
論文 参考訳(メタデータ) (2022-08-20T16:06:53Z) - Hierarchical Similarity Learning for Language-based Product Image
Retrieval [40.83290730640458]
本稿では,クロスモーダル類似度測定に着目し,新しい階層的類似度学習ネットワークを提案する。
大規模製品検索データセットの実験により,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2021-02-18T14:23:16Z) - Do Explicit Alignments Robustly Improve Multilingual Encoders? [22.954688396858085]
多言語エンコーダは、言語間表現を効果的に学習することができる。
EuroparlやMultiUNのようなbitextsに基づく明示的なアライメント目的は、これらの表現をさらに改善することが示されている。
このような信号をよりよく活用できる新しいコントラストアライメント目的を提案する。
論文 参考訳(メタデータ) (2020-10-06T07:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。