論文の概要: Read, Retrospect, Select: An MRC Framework to Short Text Entity Linking
- arxiv url: http://arxiv.org/abs/2101.02394v1
- Date: Thu, 7 Jan 2021 06:17:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 13:40:24.014863
- Title: Read, Retrospect, Select: An MRC Framework to Short Text Entity Linking
- Title(参考訳): read, retrospect, select: 短いテキストエンティティリンクのためのmrcフレームワーク
- Authors: Yingjie Gu, Xiaoye Qu, Zhefeng Wang, Baoxing Huai, Nicholas Jing Yuan
and Xiaolin Gui
- Abstract要約: マルチターン多重選択機械読解法という新しい枠組みを提案する。
周囲のコンテキストを利用するあいまいな言及ごとにクエリが生成される。
オプション選択モジュールを使用して、クエリを使用した候補からゴールデンエンティティを識別する。
- 参考スコア(独自算出の注目度): 8.862547190078487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity linking (EL) for the rapidly growing short text (e.g. search queries
and news titles) is critical to industrial applications. Most existing
approaches relying on adequate context for long text EL are not effective for
the concise and sparse short text. In this paper, we propose a novel framework
called Multi-turn Multiple-choice Machine reading comprehension (M3}) to solve
the short text EL from a new perspective: a query is generated for each
ambiguous mention exploiting its surrounding context, and an option selection
module is employed to identify the golden entity from candidates using the
query. In this way, M3 framework sufficiently interacts limited context with
candidate entities during the encoding process, as well as implicitly considers
the dissimilarities inside the candidate bunch in the selection stage. In
addition, we design a two-stage verifier incorporated into M3 to address the
commonly existed unlinkable problem in short text. To further consider the
topical coherence and interdependence among referred entities, M3 leverages a
multi-turn fashion to deal with mentions in a sequence manner by retrospecting
historical cues. Evaluation shows that our M3 framework achieves the
state-of-the-art performance on five Chinese and English datasets for the
real-world short text EL.
- Abstract(参考訳): 急速に成長する短いテキスト(例)に対するエンティティリンク(EL)
検索クエリとニュースタイトル)は産業アプリケーションにとって重要である。
長いテキスト EL の適切なコンテキストに依存する既存のアプローチは、簡潔でスパースな短文には有効ではない。
本稿では,その周辺環境を利用した曖昧な言及ごとにクエリを生成し,そのクエリを用いた候補から黄金の実体を識別するためにオプション選択モジュールを用いるという,短いテキストELを新しい視点から解くための,Multi-turn Multi-choice Machine read comprehension (M3}) という新しいフレームワークを提案する。
このようにして、M3フレームワークは符号化プロセス中に限定されたコンテキストと十分に相互作用し、選択段階における候補群内の相違を暗黙的に考慮する。
さらに,M3に組み込まれた2段階検証器を設計し,短文の非リンク性問題に対処する。
参照エンティティ間のトピックの一貫性と相互依存性をさらに考慮するために、M3は、複数ターンのスタイルを活用して、歴史的手がかりを振り返って参照をシーケンス的に扱う。
評価の結果、m3フレームワークは、現実世界の短文elの5つの中国語と英語のデータセットで最先端のパフォーマンスを実現しています。
関連論文リスト
- M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding [63.33447665725129]
M3DocRAGは、様々な文書コンテキストに柔軟に対応する新しいマルチモーダルRAGフレームワークである。
M3DocRAGは視覚情報を保存しながら、単一の文書や多数の文書を効率的に処理できる。
M3DocVQAはオープンドメインDocVQAを3,000以上のPDFドキュメントと4万以上のページで評価するための新しいベンチマークである。
論文 参考訳(メタデータ) (2024-11-07T18:29:38Z) - Extract, Define, Canonicalize: An LLM-based Framework for Knowledge Graph Construction [12.455647753787442]
抽出・デファイン・カノニケーズ(EDC)という3相フレームワークを提案する。
EDCはフレキシブルで、事前に定義されたターゲットスキーマが利用可能で、そうでない場合に適用される。
EDCがパラメータチューニングなしで高品質な三重項を抽出できることを実証する。
論文 参考訳(メタデータ) (2024-04-05T02:53:51Z) - A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - A Dual-way Enhanced Framework from Text Matching Point of View for Multimodal Entity Linking [17.847936914174543]
マルチモーダルエンティティリンク(MEL)は、ウィキペディアのような知識グラフ(KG)のエンティティに曖昧な言及を多モーダル情報にリンクすることを目的としている。
我々は、各マルチモーダル情報(テキストと画像)をクエリとして扱うニューラルテキストマッチング問題として、マルチモーダルエンティティリンクを定式化する。
本稿では,MELのための双方向拡張(DWE)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-19T03:15:50Z) - A Read-and-Select Framework for Zero-shot Entity Linking [33.15662306409253]
本稿では、エンティティの曖昧さの主成分をモデル化し、リード・アンド・セレクト(ReS)フレームワークを提案する。
提案手法は,確立されたゼロショットエンティティリンクデータセットであるZESHELに対して,2.55%のマイクロ平均精度向上を実現している。
論文 参考訳(メタデータ) (2023-10-19T04:08:10Z) - Walking Down the Memory Maze: Beyond Context Limit through Interactive
Reading [63.93888816206071]
我々は,長いコンテキストを要約ノードのツリーに処理する手法であるMemWalkerを紹介した。クエリを受信すると,モデルがこのツリーをナビゲートして関連する情報を検索し,十分な情報を収集すると応答する。
その結果,MemWalkerは,テキストを対話的に読み取る際の推論ステップを強調し,クエリに関連するテキストセグメントをピンポイントすることで,説明性の向上を図っている。
論文 参考訳(メタデータ) (2023-10-08T06:18:14Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Cue-CoT: Chain-of-thought Prompting for Responding to In-depth Dialogue
Questions with LLMs [59.74002011562726]
我々は、よりパーソナライズされ魅力的な応答を提供するために、新しい言語的キューに基づく思考の連鎖(textitCue-CoT)を提案する。
中国語と英語の6つのデータセットからなる詳細な対話質問を用いたベンチマークを構築した。
実験により,提案手法は,すべてのデータセットにおいて,テクステルパーフルネスとテクスチタアクセプタビリティの両方の観点から,標準的プロンプト法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-19T16:27:43Z) - ET5: A Novel End-to-end Framework for Conversational Machine Reading
Comprehension [48.529698533726496]
本稿では, 対話型機械読解のための包含推論T5(ET5)に基づくエンドツーエンドフレームワークを提案する。
提案フレームワークの軽量さにもかかわらず,提案するET5は,BLEU-4スコア55.2のShARCリーダボード上で,新たな最先端結果が得られることを示す実験結果を得た。
論文 参考訳(メタデータ) (2022-09-23T08:58:03Z) - NEUer at SemEval-2021 Task 4: Complete Summary Representation by Filling
Answers into Question for Matching Reading Comprehension [10.361024307659187]
そこで我々は,質問に選択肢を埋め込んで,よりきめ細かなコンテキストを生成する新しいMRCモデルを提案する。
与えられたデータセット上で一連の実験を行い、その結果、我々のアプローチは、他のデータセットよりもかなり優れています。
論文 参考訳(メタデータ) (2021-05-25T16:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。