論文の概要: Neural Entity Linking: A Survey of Models Based on Deep Learning
- arxiv url: http://arxiv.org/abs/2006.00575v4
- Date: Thu, 7 Apr 2022 17:56:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 12:51:07.827811
- Title: Neural Entity Linking: A Survey of Models Based on Deep Learning
- Title(参考訳): Neural Entity Linking:ディープラーニングに基づくモデルの調査
- Authors: Ozge Sevgili, Artem Shelmanov, Mikhail Arkhipov, Alexander Panchenko,
Chris Biemann
- Abstract要約: 本調査では,2015年以降に開発されたニューラルエンティティリンク(EL)システムの包括的記述について報告する。
その目標は、ニューラルエンティティリンクシステムの設計機能を体系化し、それらのパフォーマンスを一般的なベンチマーク上の注目すべき古典的手法と比較することである。
この調査はエンティティリンクの応用に焦点をあて、最近出現した、深い事前訓練されたマスキング言語モデルを強化するユースケースに焦点を当てている。
- 参考スコア(独自算出の注目度): 82.43751915717225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This survey presents a comprehensive description of recent neural entity
linking (EL) systems developed since 2015 as a result of the "deep learning
revolution" in natural language processing. Its goal is to systemize design
features of neural entity linking systems and compare their performance to the
remarkable classic methods on common benchmarks. This work distills a generic
architecture of a neural EL system and discusses its components, such as
candidate generation, mention-context encoding, and entity ranking, summarizing
prominent methods for each of them. The vast variety of modifications of this
general architecture are grouped by several common themes: joint entity mention
detection and disambiguation, models for global linking, domain-independent
techniques including zero-shot and distant supervision methods, and
cross-lingual approaches. Since many neural models take advantage of entity and
mention/context embeddings to represent their meaning, this work also overviews
prominent entity embedding techniques. Finally, the survey touches on
applications of entity linking, focusing on the recently emerged use-case of
enhancing deep pre-trained masked language models based on the Transformer
architecture.
- Abstract(参考訳): 本調査では、自然言語処理における「深層学習革命」の結果、2015年以降に開発された最近のニューラルエンティティリンク(EL)システムの包括的記述を示す。
その目標は、ニューラルエンティティリンクシステムの設計機能を体系化し、それらのパフォーマンスを一般的なベンチマーク上の注目すべき古典的手法と比較することである。
この研究は、ニューラルELシステムの汎用アーキテクチャを蒸留し、候補生成、参照コンテキストエンコーディング、エンティティランキングなどのコンポーネントを議論し、それぞれに顕著なメソッドを要約する。
統合エンティティは検出と曖昧さを言及し、グローバルリンクのモデル、ゼロショットおよび遠距離監視手法を含むドメインに依存しない技術、言語間のアプローチを言及している。
多くのニューラルモデルがエンティティと参照/コンテキスト埋め込みを利用してその意味を表現しているため、この研究は著名なエンティティ埋め込み技術も概観している。
最後に、この調査はエンティティリンクの応用に焦点を当て、Transformerアーキテクチャに基づいた深層学習済みのマスク付き言語モデルの拡張という最近出現したユースケースに焦点を当てている。
関連論文リスト
- A VAE-based Framework for Learning Multi-Level Neural Granger-Causal
Connectivity [15.295157876811066]
本稿では, 関連系・異種系系の集合において, 成分間の顆粒・因果関係を共同で学習する変分オートエンコーダに基づくフレームワークを提案する。
提案するフレームワークの性能は,複数の合成データ設定に基づいて評価し,個別のシステム学習用に設計された既存手法と比較した。
論文 参考訳(メタデータ) (2024-02-25T16:11:32Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文 参考訳(メタデータ) (2023-03-20T18:19:36Z) - Decoupled Context Processing for Context Augmented Language Modeling [33.89636308731306]
言語モデルはコンテキストレトリバーで拡張することができ、大きな外部データベースからの知識を組み込むことができる。
検索したコンテキストを活用することで、ニューラルネットワークは内部パラメータ内の膨大な世界の知識を記憶する必要がなく、効率性、解釈可能性、モジュール性が向上する。
論文 参考訳(メタデータ) (2022-10-11T20:05:09Z) - A Review of Sparse Expert Models in Deep Learning [23.721204843236006]
スパースエキスパートモデル(Sparse expert model)は、ディープラーニングの一般的なアーキテクチャとして再開発される30年前のコンセプトだ。
本稿では,スパースエキスパートモデルの概念を概観し,共通アルゴリズムの基本的記述を提供し,深層学習時代の進歩を文脈化する。
論文 参考訳(メタデータ) (2022-09-04T18:00:29Z) - Redefining Neural Architecture Search of Heterogeneous Multi-Network
Models by Characterizing Variation Operators and Model Components [71.03032589756434]
複素領域における異なる変動演算子の効果について検討する。
モデルの複雑さと性能に影響を及ぼす変化演算子と、それを構成する異なる部分の質を推定する様々な指標に依存するモデルの両方を特徴付ける。
論文 参考訳(メタデータ) (2021-06-16T17:12:26Z) - Polynomial Networks in Deep Classifiers [55.90321402256631]
我々は深層ニューラルネットワークの研究を統一的な枠組みで行った。
私たちのフレームワークは、各モデルの誘導バイアスに関する洞察を提供します。
提案モデルの有効性を,標準画像および音声分類ベンチマークで評価した。
論文 参考訳(メタデータ) (2021-04-16T06:41:20Z) - Model-Based Machine Learning for Communications [110.47840878388453]
モデルベースのアルゴリズムと機械学習をハイレベルな視点で組み合わせるための既存の戦略を見直します。
通信受信機の基本的なタスクの一つであるシンボル検出に注目する。
論文 参考訳(メタデータ) (2021-01-12T19:55:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。