論文の概要: Entity Alignment For Knowledge Graphs: Progress, Challenges, and
Empirical Studies
- arxiv url: http://arxiv.org/abs/2205.08777v1
- Date: Wed, 18 May 2022 07:59:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-19 17:55:56.918704
- Title: Entity Alignment For Knowledge Graphs: Progress, Challenges, and
Empirical Studies
- Title(参考訳): 知識グラフのためのエンティティアライメント:進歩、挑戦、実証研究
- Authors: Deepak Chaurasiya, Anil Surisetty, Nitish Kumar, Alok Singh, Vikrant
Dey, Aakarsh Malhotra, Gaurav Dhama and Ankur Arora
- Abstract要約: エンティティアライメント(EA)は、同じエンティティを参照するデータベースをまたいだエンティティを識別する。
EAメソッドはエンティティを低次元空間にマッピングし、それらの類似性に基づいてそれらを調整する。
本稿では,既存のEA手法を包括的に分析し,その応用と限界について検討する。
- 参考スコア(独自算出の注目度): 4.221619479687067
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Entity Alignment (EA) identifies entities across databases that refer to the
same entity. Knowledge graph-based embedding methods have recently dominated EA
techniques. Such methods map entities to a low-dimension space and align them
based on their similarities. With the corpus of EA methodologies growing
rapidly, this paper presents a comprehensive analysis of various existing EA
methods, elaborating their applications and limitations. Further, we
distinguish the methods based on their underlying algorithms and the
information they incorporate to learn entity representations. Based on
challenges in industrial datasets, we bring forward $4$ research questions
(RQs). These RQs empirically analyse the algorithms from the perspective of
\textit{Hubness, Degree distribution, Non-isomorphic neighbourhood,} and
\textit{Name bias}. For Hubness, where one entity turns up as the nearest
neighbour of many other entities, we define an $h$-score to quantify its effect
on the performance of various algorithms. Additionally, we try to level the
playing field for algorithms that rely primarily on name-bias existing in the
benchmarking open-source datasets by creating a low name bias dataset. We
further create an open-source repository for $14$ embedding-based EA methods
and present the analysis for invoking further research motivations in the field
of EA.
- Abstract(参考訳): エンティティアライメント(EA)は、同じエンティティを参照するデータベースをまたいだエンティティを識別する。
近年,知識グラフに基づく埋め込み手法がEA技術を支配している。
このような方法は、エンティティを低次元空間にマッピングし、それらの類似性に基づいてそれらを調整する。
本稿では, EA方法論のコーパスが急速に成長する中で, 既存のEA手法を包括的に分析し, 適用範囲と限界について検討する。
さらに,その基礎となるアルゴリズムと,それらが組み込んだ情報に基づいて,実体表現を学習する手法を識別する。
産業データセットの課題に基づいて、4ドルの研究開発質問(RQ)を提示します。
これらのRQは、アルゴリズムを \textit{Hubness, Degree distribution, Non-isomorphic neighborhoodhood,} および \textit{Name bias} の観点から経験的に分析する。
1つのエンティティが他の多くのエンティティの最も近い近傍として現れるHubnessでは、様々なアルゴリズムの性能への影響を定量化するために$h$-scoreを定義します。
さらに、低名バイアスデータセットを作成することにより、ベンチマーク対象のオープンソースデータセットに存在する名前バイアスに依存するアルゴリズムのプレイフィールドのレベル付けを試みる。
さらに、埋め込みベースのEAメソッド14ドルでオープンソースリポジトリを作成し、EA分野におけるさらなる研究モチベーションを呼び起こすための分析を提示する。
関連論文リスト
- DERA: Dense Entity Retrieval for Entity Alignment in Knowledge Graphs [3.500936203815729]
エンティティアライメント(EA)のための高密度エンティティ検索フレームワークを提案する。
我々は言語モデルを活用し、エンティティの様々な特徴を均一にエンコードし、知識グラフ(KG)をまたいで最も近いエンティティ検索を容易にする。
提案手法は,既存のEA手法と比較して最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-08-02T10:12:42Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - Toward Practical Entity Alignment Method Design: Insights from New
Highly Heterogeneous Knowledge Graph Datasets [32.68422342604253]
実運用環境でのエンティティアライメント(EA)手法の性能について検討し、特に高ヘテロジニアスKG(HHKG)のアライメントに着目した。
以上の結果から,HHKGと協調して,メッセージパッシングやアグリゲーション機構を通じて,貴重な構造情報を活用できることが示唆された。
これらの結果は、すべてのEAデータセットに対するパナセアとして、GNNベースの手法の従来の適用に関連する潜在的な問題に光を当てた。
論文 参考訳(メタデータ) (2023-04-07T04:10:26Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - EventEA: Benchmarking Entity Alignment for Event-centric Knowledge
Graphs [17.27027602556303]
過去の進歩は偏りと不整合性評価によるものであることが示されています。
我々は、イベント中心のKGに基づいて、異種関係と属性を持つ新しいデータセットを構築した。
この問題に対する新たなアプローチとして,エンティティアライメントのためのタイムアウェアリテラルエンコーダを提案する。
論文 参考訳(メタデータ) (2022-11-05T05:34:21Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Exploring and Evaluating Attributes, Values, and Structures for Entity
Alignment [100.19568734815732]
エンティティアライメント(EA)は、さまざまなKGから等価なエンティティをリンクすることで、リッチコンテンツの統合知識グラフ(KG)を構築することを目的としている。
属性・トリプルは重要なアライメント信号も提供できますが、まだ十分に調査されていません。
本稿では,属性値エンコーダを用いてKGをサブグラフに分割し,属性の様々なタイプを効率的にモデル化することを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:03:58Z) - A Benchmarking Study of Embedding-based Entity Alignment for Knowledge
Graphs [30.296238600596997]
エンティティアライメントは、同じ現実世界のオブジェクトを参照する異なる知識グラフ内のエンティティを探します。
KG埋め込みの最近の進歩は、埋め込みに基づくエンティティアライメントの出現を示唆している。
我々は,最近の埋め込み型エンティティアライメントアプローチを23回調査し,その技術と特徴に基づいて分類した。
論文 参考訳(メタデータ) (2020-03-10T05:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。