論文の概要: Novel Entity Discovery from Web Tables
- arxiv url: http://arxiv.org/abs/2002.00206v1
- Date: Sat, 1 Feb 2020 13:24:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 01:04:28.455648
- Title: Novel Entity Discovery from Web Tables
- Title(参考訳): Web テーブルからの新しいエンティティ発見
- Authors: Shuo Zhang and Edgar Meij and Krisztian Balog and Ridho Reinanda
- Abstract要約: Web上のテーブルを活用して、新しいエンティティ、プロパティ、関係を見つけます。
提案手法は,in-KB (known')エンティティの外部情報だけでなく,新規なエイリアスも識別する。
- 参考スコア(独自算出の注目度): 21.16349961050804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When working with any sort of knowledge base (KB) one has to make sure it is
as complete and also as up-to-date as possible. Both tasks are non-trivial as
they require recall-oriented efforts to determine which entities and
relationships are missing from the KB. As such they require a significant
amount of labor. Tables on the Web, on the other hand, are abundant and have
the distinct potential to assist with these tasks. In particular, we can
leverage the content in such tables to discover new entities, properties, and
relationships. Because web tables typically only contain raw textual content we
first need to determine which cells refer to which known entities---a task we
dub table-to-KB matching. This first task aims to infer table semantics by
linking table cells and heading columns to elements of a KB. Then second task
builds upon these linked entities and properties to not only identify novel
ones in the same table but also to bootstrap their type and additional
relationships. We refer to this process as novel entity discovery and, to the
best of our knowledge, it is the first endeavor on mining the unlinked cells in
web tables. Our method identifies not only out-of-KB (``novel'') information
but also novel aliases for in-KB (``known'') entities. When evaluated using
three purpose-built test collections, we find that our proposed approaches
obtain a marked improvement in terms of precision over our baselines whilst
keeping recall stable.
- Abstract(参考訳): あらゆる種類の知識ベース(KB)で作業する場合、それを可能な限り完了し、可能な限り最新のものにする必要があります。
どちらのタスクもkbからどのエンティティとリレーションが欠けているかを決定するためにリコール指向の努力を必要とするため、非自明である。
そのため、かなりの労力を要する。
一方、Web上のテーブルは豊富であり、これらのタスクをアシストする明確な可能性を秘めている。
特に、そのようなテーブル内のコンテンツを利用して、新しいエンティティ、プロパティ、関係を見つけることができます。
Webテーブルは、通常、生のテキストコンテンツしか含まないので、まず、どの既知のエンティティを参照しているかを判断する必要があります。
この最初のタスクは、テーブルセルと列をKBの要素にリンクすることでテーブルセマンティクスを推論することを目的としている。
次に第2のタスクは、これらのリンクされたエンティティとプロパティの上に構築され、同じテーブルにある新しいエンティティを識別するだけでなく、それらのタイプと追加の関係をブートストラップする。
我々は、このプロセスを新しい実体発見と呼び、私たちの知る限り、リンクされていない細胞をWebテーブルにマイニングするための最初の取り組みである。
提案手法は,in-KB(`known')エンティティのアウト・オブ・KB(``novel'')情報だけでなく,新規なエイリアスも識別する。
3つのテストコレクションを用いて評価すると,提案手法はリコールを安定に保ちながら,ベースラインの精度を大幅に向上することがわかった。
関連論文リスト
- Relational Multi-Task Learning: Modeling Relations between Data and
Tasks [84.41620970886483]
マルチタスク学習における主要な前提は、推論時にモデルが与えられたデータポイントにのみアクセスできるが、他のタスクからのデータポイントのラベルにはアクセスできないことである。
ここでは、補助的なタスクからデータポイントラベルを活用してより正確な予測を行う、新しいリレーショナルマルチタスク学習環境を提案する。
私たちはMetaLinkを開発し、そこではデータポイントとタスクを接続するナレッジグラフを構築します。
論文 参考訳(メタデータ) (2023-03-14T07:15:41Z) - Reveal the Unknown: Out-of-Knowledge-Base Mention Discovery with Entity
Linking [23.01938139604297]
NIL エンティティとマッチングすることで、対応するKB エンティティを持たない参照を識別できるBERT ベースの Entity Linking (EL) 手法を提案する。
5つのデータセットの結果は、既存のメソッドよりもBLINKoutの方がKB外参照を識別できるという利点を示している。
論文 参考訳(メタデータ) (2023-02-14T17:00:06Z) - Visual Named Entity Linking: A New Dataset and A Baseline [61.38231023490981]
入力は画像のみで構成される純粋にビジュアルな名前付きエンティティリンク(VNEL)タスクを考える。
本稿では,視覚的・視覚的エンティティリンク(V2VEL),視覚的・テキスト的エンティティリンク(V2TEL),視覚的・テキスト的エンティティリンク(V2VEL)の3つのサブタスクを提案する。
WIKIPersonという,高品質な人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人称人
論文 参考訳(メタデータ) (2022-11-09T13:27:50Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Tab2Know: Building a Knowledge Base from Tables in Scientific Papers [6.514665180383298]
本稿では,学術論文の表から知識ベースを構築するための,新たなエンドツーエンドシステムであるTab2Knowを紹介する。
統計に基づく分類器と論理に基づく推論の両方を利用するパイプラインを提案する。
コンピュータサイエンス分野における論文のコーパスを用いたアプローチの実証評価は,満足度を回復した。
論文 参考訳(メタデータ) (2021-07-28T11:56:53Z) - BERT Meets Relational DB: Contextual Representations of Relational
Databases [4.029818252558553]
複数のテーブルからなる関係データベース上でエンティティの低次元表現を学習する問題に対処する。
これらの注意に基づくモデルを使用して、リレーショナルデータベース内のエンティティの埋め込みを学ぶ方法を検討します。
論文 参考訳(メタデータ) (2021-04-30T11:23:26Z) - TCN: Table Convolutional Network for Web Table Interpretation [52.32515851633981]
テーブル内情報とテーブル間情報の両方を考慮した新しいテーブル表現学習手法を提案する。
カラムタイプ予測ではf1の4.8%、カラム対関係予測ではf1の4.1%で競合ベースラインを上回ることができる。
論文 参考訳(メタデータ) (2021-02-17T02:18:10Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - TURL: Table Understanding through Representation Learning [29.6016859927782]
TURLは、リレーショナルWebテーブルに事前トレーニング/ファインタニングパラダイムを導入する新しいフレームワークである。
事前学習中、我々のフレームワークは教師なしの方法で関係表上の深い文脈化された表現を学習する。
我々は,TURLがすべてのタスクを一般化し,既存のメソッドをほぼすべてのインスタンスで大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-26T05:44:54Z) - Exploring the Combination of Contextual Word Embeddings and Knowledge
Graph Embeddings [0.0]
知識ベース(KB)の埋め込みは、単語によって示されるエンティティ間の明示的な関係をキャプチャするが、これらの単語のシナタマティックな特性を直接キャプチャすることはできない。
コンテキストとKBの埋め込みを併用した新しい手法を提案する。
論文 参考訳(メタデータ) (2020-04-17T17:49:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。