論文の概要: Low-rank Subspaces for Unsupervised Entity Linking
- arxiv url: http://arxiv.org/abs/2104.08737v1
- Date: Sun, 18 Apr 2021 06:24:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:25:21.675728
- Title: Low-rank Subspaces for Unsupervised Entity Linking
- Title(参考訳): 教師なしエンティティリンクのための低ランクサブスペース
- Authors: Akhil Arora, Alberto Garcia-Duran, Robert West
- Abstract要約: 固有テーマは、文書に真に言及されているエンティティが、文書内のすべての候補エンティティの集合の意味的に密接なサブセットを形成する傾向があるという事実を利用する。
実証的な面では,既存の最先端技術と比較して,複数の強靭なベースラインを導入する。
- 参考スコア(独自算出の注目度): 5.863045195556266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity linking is an important problem with many applications. Most previous
solutions were designed for settings where annotated training data is
available, which is, however, not the case in numerous domains. We propose a
light-weight and scalable entity linking method, Eigenthemes, that relies
solely on the availability of entity names and a referent knowledge base.
Eigenthemes exploits the fact that the entities that are truly mentioned in a
document (the "gold entities") tend to form a semantically dense subset of the
set of all candidate entities in the document. Geometrically speaking, when
representing entities as vectors via some given embedding, the gold entities
tend to lie in a low-rank subspace of the full embedding space. Eigenthemes
identifies this subspace using the singular value decomposition and scores
candidate entities according to their proximity to the subspace. On the
empirical front, we introduce multiple strong baselines that compare favorably
to the existing state of the art. Extensive experiments on benchmark datasets
from a variety of real-world domains showcase the effectiveness of our
approach.
- Abstract(参考訳): エンティティリンクは多くのアプリケーションにとって重要な問題です。
以前のほとんどのソリューションは、注釈付きトレーニングデータが利用可能な設定用に設計されているが、多くのドメインではそうではない。
本稿では,エンティティ名と参照知識ベースの可用性のみに依存する軽量でスケーラブルなエンティティリンク手法であるEigenthemesを提案する。
eigenthemesは、ドキュメントに真に言及されているエンティティ("金のエンティティ")が、ドキュメント内のすべての候補エンティティのセットの意味的に密接なサブセットを形成する傾向があるという事実を利用する。
幾何学的に言えば、与えられた埋め込みを通じて実体をベクトルとして表現するとき、金の実体は全埋め込み空間の低ランク部分空間に置かれる傾向がある。
固有テーマは特異値分解を用いてこの部分空間を識別し、その部分空間に近接して候補実体をスコアする。
実証的な面では,既存の最先端技術と比較して,複数の強靭なベースラインを導入する。
様々な実世界ドメインのベンチマークデータセットに関する広範囲な実験は、このアプローチの有効性を示している。
関連論文リスト
- Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - Entity6K: A Large Open-Domain Evaluation Dataset for Real-World Entity Recognition [100.39728263079736]
実世界のエンティティ認識のための包括的なデータセットであるEntity6Kを紹介する。
26のカテゴリに5700のエンティティがあり、それぞれがアノテーション付きの5つの人間認証イメージによってサポートされている。
論文 参考訳(メタデータ) (2024-03-19T01:07:53Z) - Seed-Guided Fine-Grained Entity Typing in Science and Engineering
Domains [51.02035914828596]
科学・工学分野において,シード誘導型細粒度エンティティタイピングの課題について検討する。
まず、ラベルのないコーパスから各タイプのエンティティを抽出し、弱い監視力を高めるSETypeを提案する。
そして、リッチなエンティティをラベルなしのテキストにマッチさせ、擬似ラベル付きサンプルを取得し、見知らぬ型と見えない型の両方に推論できるテキストエンテリメントモデルを訓練する。
論文 参考訳(メタデータ) (2024-01-23T22:36:03Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - EventEA: Benchmarking Entity Alignment for Event-centric Knowledge
Graphs [17.27027602556303]
過去の進歩は偏りと不整合性評価によるものであることが示されています。
我々は、イベント中心のKGに基づいて、異種関係と属性を持つ新しいデータセットを構築した。
この問題に対する新たなアプローチとして,エンティティアライメントのためのタイムアウェアリテラルエンコーダを提案する。
論文 参考訳(メタデータ) (2022-11-05T05:34:21Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Improving Entity Linking through Semantic Reinforced Entity Embeddings [16.868791358905916]
そこで本稿では, コンテキスト共通性の学習を容易にするため, 実体埋め込みに微粒な意味情報を注入する手法を提案する。
エンティティの埋め込みに基づいて、エンティティリンクにおける最先端のパフォーマンスを新たに達成しました。
論文 参考訳(メタデータ) (2021-06-16T00:27:56Z) - Neural Production Systems [90.75211413357577]
視覚環境は、異なるオブジェクトまたはエンティティから構成される。
イメージをエンティティに分割するために、ディープラーニング研究者は構造的誘導バイアスを提案した。
私たちは認知科学からインスピレーションを得て、一連のルールテンプレートからなる古典的なアプローチを復活させます。
このアーキテクチャは柔軟でダイナミックな制御フローを実現し、エンティティ固有およびルールベースの情報を分解するのに役立つ。
論文 参考訳(メタデータ) (2021-03-02T18:53:20Z) - Entity Linking via Dual and Cross-Attention Encoders [16.23946458604865]
同一空間における参照やエンティティ表現を学習するデュアルエンコーダエンティティ検索システムを提案する。
次に、ターゲット参照と候補エンティティのそれぞれに対して、クロスアテンションエンコーダを使用してエンティティをリランクする。
TACKBP-2010データセットでは,92.05%の精度で最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-04-07T17:28:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。