論文の概要: Capturing Knowledge of Emerging Entities From Extended Search Snippets
- arxiv url: http://arxiv.org/abs/2104.01105v1
- Date: Wed, 17 Mar 2021 15:34:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 20:50:44.792683
- Title: Capturing Knowledge of Emerging Entities From Extended Search Snippets
- Title(参考訳): 拡張検索スニペットからの創発的エンティティの把握
- Authors: Sunday C. Ngwobia and Saeedeh Shekarpour and Faisal Alshargi
- Abstract要約: 我々は、トップn検索スニペットから拡張されたコーパスから、出現するエンティティに関する2種類の知識をキャプチャするアプローチを開発した。
我々のアプローチは、テキスト分析とエンティティ埋め込みに基づく教師なしのアプローチである。
実験の結果,エンティティの認識には87%以上,ランキングには75%以上と有望な結果が得られた。
- 参考スコア(独自算出の注目度): 1.850809471741403
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Google and other search engines feature the entity search by representing a
knowledge card summarizing related facts about the user-supplied entity.
However, the knowledge card is limited to certain entities that have a Wiki
page or an entry in encyclopedias such as Freebase. The current encyclopedias
are limited to highly popular entities, which are far fewer compared with the
emerging entities. Despite the availability of knowledge about the emerging
entities on the search results, yet there are no approaches to capture,
abstract, summerize, fuse, and validate fragmented pieces of knowledge about
them. Thus, in this paper, we develop approaches to capture two types of
knowledge about the emerging entities from a corpus extended from top-n search
snippets of a given emerging entity. The first kind of knowledge identifies the
role(s) of the emerging entity as, e.g., who is s/he? The second kind captures
the entities closely associated with the emerging entity. As the testbed, we
considered a collection of 20 emerging entities and 20 popular entities as the
ground truth. Our approach is an unsupervised approach based on text analysis
and entity embeddings. Our experimental studies show promising results as the
accuracy of more than $87\%$ for recognizing entities and $75\%$ for ranking
them. Besides $87\%$ of the entailed types were recognizable. Our testbed and
source code is available on Github
https://github.com/sunnyUD/research_source_code.
- Abstract(参考訳): Googleや他の検索エンジンは、ユーザが提供するエンティティに関する関連事実を要約したナレッジカードを表現してエンティティ検索を行う。
しかし、知識カードはウィキページやFreebaseのような百科事典のエントリを持つ特定のエンティティに限定されている。
現在の百科事典は人気の高いエンティティに限定されており、新興のエンティティと比べてはるかに少ない。
検索結果に現れるエンティティに関する知識が利用可能であるにもかかわらず、それらに関する断片化された知識をキャプチャ、抽象化、夏期化、融合、検証するためのアプローチはない。
そこで,本稿では,現生エンティティの上位n検索スニペットから拡張したコーパスから,現生エンティティに関する2種類の知識を抽出する手法を開発した。
最初の種類の知識は、新興エンティティの役割を、例えば、s/he とは誰かというように特定します。
第2のタイプは、新興エンティティと密接に関連するエンティティをキャプチャする。
テストベッドとして,20の新興エンティティと20のポピュラーエンティティのコレクションを根拠として検討した。
私たちのアプローチは、テキスト分析とエンティティ埋め込みに基づく教師なしのアプローチです。
実験の結果,エンティティの認識には87\%以上,ランキングには75\%以上と有望な結果が得られた。
関連した型のうち87\%は認識可能であった。
テストベッドとソースコードはgithub https://github.com/sunnyud/research_source_codeで入手できます。
関連論文リスト
- What Really is Commonsense Knowledge? [58.5342212738895]
我々は、既存のコモンセンス知識の定義を調査し、概念を定義するための3つのフレームワークに基礎を置き、それらをコモンセンス知識の統一的な定義に統合する。
次に、アノテーションと実験のための統合された定義をCommonsenseQAとCommonsenseQA 2.0データセットで使用します。
本研究は,2つのデータセットには非常識知識のインスタンスが多数存在し,これら2つのサブセットに対して大きな性能差があることを示す。
論文 参考訳(メタデータ) (2024-11-06T14:54:19Z) - Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - A topic-aware graph neural network model for knowledge base updating [0.6875312133832077]
主な課題は、最新の知識ベースを維持することです。
現在の知識ベース更新方法は、エンティティを更新する必要があるかどうかを決定する。
ユーザクエリログに基づく知識更新のためのトピック対応グラフネットワークを構築した。
論文 参考訳(メタデータ) (2022-08-31T02:35:23Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Entity Context Graph: Learning Entity Representations
fromSemi-Structured Textual Sources on the Web [44.92858943475407]
エンティティ中心のテキスト知識ソースを処理してエンティティ埋め込みを学ぶアプローチを提案する。
私たちのアプローチから学んだ埋め込みは、(i)高品質で、既知の知識グラフベースの埋め込みに匹敵し、それらをさらに改善するために使用することができます。
論文 参考訳(メタデータ) (2021-03-29T20:52:14Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。