論文の概要: Reveal the Unknown: Out-of-Knowledge-Base Mention Discovery with Entity
Linking
- arxiv url: http://arxiv.org/abs/2302.07189v3
- Date: Fri, 11 Aug 2023 13:57:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 17:35:35.453350
- Title: Reveal the Unknown: Out-of-Knowledge-Base Mention Discovery with Entity
Linking
- Title(参考訳): Reveal the Unknown: エンティティリンクによるアウトオブ知識ベースメンションディスカバリ
- Authors: Hang Dong, Jiaoyan Chen, Yuan He, Yinan Liu, Ian Horrocks
- Abstract要約: NIL エンティティとマッチングすることで、対応するKB エンティティを持たない参照を識別できるBERT ベースの Entity Linking (EL) 手法を提案する。
5つのデータセットの結果は、既存のメソッドよりもBLINKoutの方がKB外参照を識別できるという利点を示している。
- 参考スコア(独自算出の注目度): 38.4735720092217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discovering entity mentions that are out of a Knowledge Base (KB) from texts
plays a critical role in KB maintenance, but has not yet been fully explored.
The current methods are mostly limited to the simple threshold-based approach
and feature-based classification, and the datasets for evaluation are
relatively rare. We propose BLINKout, a new BERT-based Entity Linking (EL)
method which can identify mentions that do not have corresponding KB entities
by matching them to a special NIL entity. To better utilize BERT, we propose
new techniques including NIL entity representation and classification, with
synonym enhancement. We also apply KB Pruning and Versioning strategies to
automatically construct out-of-KB datasets from common in-KB EL datasets.
Results on five datasets of clinical notes, biomedical publications, and
Wikipedia articles in various domains show the advantages of BLINKout over
existing methods to identify out-of-KB mentions for the medical ontologies,
UMLS, SNOMED CT, and the general KB, WikiData.
- Abstract(参考訳): テキストから知識ベース(kb)外にあるエンティティ参照を見つけることは、kbのメンテナンスにおいて重要な役割を果たすが、まだ完全には検討されていない。
現在の手法は主に単純なしきい値に基づくアプローチと特徴に基づく分類に限られており、評価のためのデータセットは比較的稀である。
我々はBERTベースの新しいエンティティリンク(EL)手法であるBLINKoutを提案し、特別なNILエンティティとマッチングすることで、対応するKBエンティティを持たない参照を識別する。
BERT をよりよく活用するために,NIL エンティティの表現と分類を含む新しい手法を提案する。
また、KBプルーニングとバージョニングの手法を用いて、共通のKB内ELデータセットからKB外のデータセットを自動的に構築する。
臨床ノート, バイオメディカル出版, ウィキペディア記事の5つのデータセットの結果は, 医療オントロジー, UMLS, SNOMED CT, 一般KB, WikiDataの既往の記載を識別する手法よりも, BLINKoutの利点を示している。
関連論文リスト
- UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Mapping and Cleaning Open Commonsense Knowledge Bases with Generative
Translation [14.678465723838599]
特にオープン情報抽出(OpenIE)は、テキストから構造を誘導するためにしばしば用いられる。
OpenIEには、オープンエンドで非標準化された関係が含まれており、抽出された知識の下流での搾取を困難にしている。
本稿では,言語モデルを訓練し,オープンな言語から固定的なアサーションを生成することによって,生成的翻訳による問題にアプローチすることを提案する。
論文 参考訳(メタデータ) (2023-06-22T09:42:54Z) - Exploring Partial Knowledge Base Inference in Biomedical Entity Linking [0.4798394926736971]
我々はこのシナリオを部分的知識ベース推論と呼ぶ。
我々は, ベンチマークを構築し, 劇的な精度低下によるEL性能の破滅的な劣化を目撃する。
計算オーバーヘッドの少ない2つのNIL問題に対して, 単純かつ効果的に対処する手法を提案する。
論文 参考訳(メタデータ) (2023-03-18T04:31:07Z) - QA Is the New KR: Question-Answer Pairs as Knowledge Bases [105.692569000534]
提案するKBの形式は,従来のシンボリックKBの重要な利点を多く備えている,と我々は主張する。
従来のKBとは異なり、この情報ストアは一般的なユーザ情報のニーズによく適合している。
論文 参考訳(メタデータ) (2022-07-01T19:09:08Z) - Named Entity Linking on Namesakes [10.609815608017065]
知識ベース(KB)エンティティを埋め込みで表現する。
知識ベース(KB)におけるエンティティの表現をKBデータのみを用いて調整できることを示し,NELの性能を向上させる。
論文 参考訳(メタデータ) (2022-05-21T03:31:25Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Reasoning Over Virtual Knowledge Bases With Open Predicate Relations [85.19305347984515]
Open Predicate Query Language (OPQL) を紹介します。
OPQLは、テキストから完全にトレーニングされた仮想知識ベース(VKB)を構築する方法である。
OPQLは2つの異なるKB推論タスクにおいて、以前のVKBメソッドよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-14T01:29:54Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Learning Knowledge Bases with Parameters for Task-Oriented Dialogue
Systems [79.02430277138801]
知識ベース(KB)は、ユーザの要求を満たす上で重要な役割を担います。
エンド・ツー・エンドのシステムは直接KBを入力として使用するが、KBが数百のエントリより大きい場合にはスケールできない。
モデルパラメータに直接KBを埋め込む手法を提案する。
論文 参考訳(メタデータ) (2020-09-28T22:13:54Z) - Distantly-Supervised Neural Relation Extraction with Side Information
using BERT [2.0946724304757955]
関係抽出(Relation extract、RE)は、文内のエンティティ間の関係を分類する。
この戦略を採用する方法の1つはRESIDEモデルであり、知識ベースからの側情報を用いた遠方の教師付きニューラルネットワーク抽出を提案する。
本稿では,この手法が最先端のベースラインより優れていることを考慮し,追加の側情報を用いたRESIDE関連手法を提案するが,BERT埋め込みによる文エンコーディングを簡略化する。
論文 参考訳(メタデータ) (2020-04-29T19:29:10Z) - Novel Entity Discovery from Web Tables [21.16349961050804]
Web上のテーブルを活用して、新しいエンティティ、プロパティ、関係を見つけます。
提案手法は,in-KB (known')エンティティの外部情報だけでなく,新規なエイリアスも識別する。
論文 参考訳(メタデータ) (2020-02-01T13:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。