論文の概要: Survey on English Entity Linking on Wikidata
- arxiv url: http://arxiv.org/abs/2112.01989v1
- Date: Fri, 3 Dec 2021 16:02:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 16:00:29.969211
- Title: Survey on English Entity Linking on Wikidata
- Title(参考訳): wikidataにおける英語エンティティリンクに関する調査
- Authors: Cedric M\"oller, Jens Lehmann, Ricardo Usbeck
- Abstract要約: Wikidataはコミュニティ主導の多言語知識グラフである。
現在のWikidata固有のEntity Linkingデータセットは、DBpediaのような他の知識グラフのためのスキームとアノテーションスキームの違いはない。
ほとんど全てのアプローチはラベルや時々記述のような特定の特性を用いるが、ハイパーリレーショナル構造のような特性は無視する。
- 参考スコア(独自算出の注目度): 3.8289963781051415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wikidata is a frequently updated, community-driven, and multilingual
knowledge graph. Hence, Wikidata is an attractive basis for Entity Linking,
which is evident by the recent increase in published papers. This survey
focuses on four subjects: (1) Which Wikidata Entity Linking datasets exist, how
widely used are they and how are they constructed? (2) Do the characteristics
of Wikidata matter for the design of Entity Linking datasets and if so, how?
(3) How do current Entity Linking approaches exploit the specific
characteristics of Wikidata? (4) Which Wikidata characteristics are unexploited
by existing Entity Linking approaches? This survey reveals that current
Wikidata-specific Entity Linking datasets do not differ in their annotation
scheme from schemes for other knowledge graphs like DBpedia. Thus, the
potential for multilingual and time-dependent datasets, naturally suited for
Wikidata, is not lifted. Furthermore, we show that most Entity Linking
approaches use Wikidata in the same way as any other knowledge graph missing
the chance to leverage Wikidata-specific characteristics to increase quality.
Almost all approaches employ specific properties like labels and sometimes
descriptions but ignore characteristics such as the hyper-relational structure.
Hence, there is still room for improvement, for example, by including
hyper-relational graph embeddings or type information. Many approaches also
include information from Wikipedia, which is easily combinable with Wikidata
and provides valuable textual information, which Wikidata lacks.
- Abstract(参考訳): wikidataは頻繁に更新され、コミュニティ主導で、多言語ナレッジグラフである。
したがって、WikidataはEntity Linkingの魅力的な基盤であり、最近の論文の増加によって明らかになっている。
1) Wikidata Entity Linkingデータセットが存在するか、どのくらい広く使われているか、どのように構築されているか。
2) Entity Linking データセットの設計において Wikidata の特徴は重要か?
(3) 現在のEntity LinkingアプローチはWikidataの特徴をどのように活用するか?
(4)ウィキデータの特徴は、既存のエンティティリンクアプローチによって未解決なのでしょうか?
この調査によると、現在のWikidata固有のEntity Linkingデータセットは、アノテーションスキームとDBpediaのような他の知識グラフのスキームとの違いはない。
したがって、ウィキデータに適した多言語および時間依存データセットの可能性は持ち上げられない。
さらに、ほとんどのEntity Linkingアプローチは、Wikidata固有の特徴を活用できない他の知識グラフと同様の方法でWikidataを使用していることを示す。
ほとんど全てのアプローチはラベルや時々記述のような特定の特性を用いるが、ハイパーリレーショナル構造のような特性は無視する。
したがって、例えば、ハイパーリレーショナルグラフの埋め込みや型情報を含めることで、改善の余地は残っている。
ウィキデータと簡単に結合でき、Wikidataに欠けている貴重なテキスト情報を提供するウィキペディアの情報も含まれている。
関連論文リスト
- Towards a Brazilian History Knowledge Graph [50.26735825937335]
ブラジル歴史辞典(DHBB)とウィキペディア/ウィキデータに基づくブラジルの歴史に関する知識グラフを構築した。
DHBBに記述されている多くの用語/エンティティがWikidataに対応する概念(またはQ項目)を持っていないことを示す。
論文 参考訳(メタデータ) (2024-03-28T22:05:32Z) - KIF: A Wikidata-Based Framework for Integrating Heterogeneous Knowledge Sources [0.45141207783683707]
我々は、異種知識ソースを仮想的に統合するためのWikidataベースのフレームワークKIFを提案する。
KIFはPythonで書かれており、オープンソースとしてリリースされている。
論文 参考訳(メタデータ) (2024-03-15T13:46:36Z) - Leveraging Wikidata's edit history in knowledge graph refinement tasks [77.34726150561087]
編集履歴は、コミュニティが何らかのファジィで分散した合意に達する過程を表す。
Wikidataで最も重要な100のクラスから、すべてのインスタンスの編集履歴を含むデータセットを構築します。
タイプ予測タスクのための知識グラフ埋め込みモデルにおいて,この編集履歴情報を活用する2つの新しい手法を提案し,評価する。
論文 参考訳(メタデータ) (2022-10-27T14:32:45Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - Does Wikidata Support Analogical Reasoning? [17.68704739786042]
Wikidataの知識が類推的推論をサポートするかどうかを検討する。
Wikidataは類似分類のためのデータ作成に利用できることを示す。
我々は、Wikidataからアナログを抽出する自動手法を導くためのメトリクスセットを考案した。
論文 参考訳(メタデータ) (2022-10-02T20:46:52Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Enriching Wikidata with Linked Open Data [4.311189028205597]
現在のリンクされたオープンデータ(LOD)ツールは、Wikidataのような大きなグラフの強化には適していない。
本稿では、ギャップ検出、ソース選択、スキーマアライメント、セマンティックバリデーションを含む新しいワークフローを提案する。
実験の結果,我々のワークフローは,高品質な外部LODソースからの数百万の新規ステートメントでWikidataを豊かにすることができることがわかった。
論文 参考訳(メタデータ) (2022-07-01T01:50:24Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Assessing the quality of sources in Wikidata across languages: a hybrid
approach [64.05097584373979]
いくつかの言語でラベルを持つWikidataのトリプルからサンプルした参照コーパスの大規模なコーパスを評価するために,一連のマイクロタスク実験を実施している。
クラウドソースアセスメントの統合されたバージョンを使用して、いくつかの機械学習モデルをトレーニングして、Wikidata全体の分析をスケールアップしています。
この結果はWikidataにおける参照の質の確認に役立ち、ユーザ生成多言語構造化データの品質をWeb上で定義し、取得する際の共通の課題を特定するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-20T10:06:46Z) - Commonsense Knowledge in Wikidata [3.8359194344969807]
本稿では,既存のコモンセンスソースを補完するコモンセンス知識をウィキデータが保持しているかどうかを検討する。
我々はWikidataとConceptNetの関係をマッピングし、Wikidata-CSを既存の統合コモンセンスグラフに統合する。
論文 参考訳(メタデータ) (2020-08-18T18:23:06Z) - Wikidata on MARS [0.20305676256390934]
一般化されたプロパティグラフの形式的データモデルとして,マルチ分散リレーショナル構造 (MARS) が提案されている。
MARPLはプロパティグラフ上の推論ルールを記述するための有用なルールベースのロジックである。
Wikidataは、Wikidataのデータ型を追加する拡張MARSでモデル化することができる。
論文 参考訳(メタデータ) (2020-08-14T22:58:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。