論文の概要: Conversational Entity Linking: Problem Definition and Datasets
- arxiv url: http://arxiv.org/abs/2105.04903v1
- Date: Tue, 11 May 2021 09:44:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 21:44:42.141474
- Title: Conversational Entity Linking: Problem Definition and Datasets
- Title(参考訳): 会話型エンティティリンク:問題定義とデータセット
- Authors: Hideaki Joko, Faegheh Hasibi, Krisztian Balog, Arjen P. de Vries
- Abstract要約: 対話システムのためのエンティティリンクの研究を行う。
既存の会話データセットから多数の対話を分析し、クラウドソーシングを用いて概念、名前付きエンティティ、個人エンティティへの注釈を付ける。
Conversational Entity LinkingデータセットであるConEL上での従来のELシステムのパフォーマンスを報告し、会話設定によく適合するこれらのメソッドの拡張を提示します。
- 参考スコア(独自算出の注目度): 21.472928615684985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine understanding of user utterances in conversational systems is of
utmost importance for enabling engaging and meaningful conversations with
users. Entity Linking (EL) is one of the means of text understanding, with
proven efficacy for various downstream tasks in information retrieval. In this
paper, we study entity linking for conversational systems. To develop a better
understanding of what EL in a conversational setting entails, we analyze a
large number of dialogues from existing conversational datasets and annotate
references to concepts, named entities, and personal entities using
crowdsourcing. Based on the annotated dialogues, we identify the main
characteristics of conversational entity linking. Further, we report on the
performance of traditional EL systems on our Conversational Entity Linking
dataset, ConEL, and present an extension to these methods to better fit the
conversational setting. The resources released with this paper include
annotated datasets, detailed descriptions of crowdsourcing setups, as well as
the annotations produced by various EL systems. These new resources allow for
an investigation of how the role of entities in conversations is different from
that in documents or isolated short text utterances like queries and tweets,
and complement existing conversational datasets.
- Abstract(参考訳): 会話システムにおけるユーザ発話の機械的理解は、ユーザと有意義な会話を可能にする上で最も重要である。
エンティティリンク(EL)はテキスト理解の手段の1つであり、情報検索において様々な下流タスクに有効であることが証明されている。
本稿では,会話システムにおけるエンティティリンクについて検討する。
会話環境におけるELの理解を深めるために,既存の会話データセットからの対話を多数分析し,クラウドソーシングを用いた概念,名前付きエンティティ,個人エンティティへの注釈付けを行う。
注釈付き対話に基づいて,対話型エンティティリンクの主な特徴を同定する。
さらに,我々の会話型エンティティリンクデータであるconelにおける従来のelシステムの性能を報告し,会話型設定に適合するためのこれらの手法の拡張を提案する。
この論文でリリースされたリソースには、注釈付きデータセット、クラウドソーシングセットアップの詳細な説明、様々なelシステムによって生成されたアノテーションが含まれる。
これらの新しいリソースは、会話におけるエンティティの役割が文書やクエリやツイートのような孤立した短いテキスト発話とどのように異なるかの調査を可能にし、既存の会話データセットを補完する。
関連論文リスト
- Investigating Low-Cost LLM Annotation for~Spoken Dialogue Understanding Datasets [9.78470355087662]
音声タスク指向対話(TOD)システムでは、ユーザの要求を記述した意味表現の選択がスムーズな対話の鍵となる。
本稿では,音声対話データセットのセマンティック表現の自動強化に関する知見を提供する。
論文 参考訳(メタデータ) (2024-06-19T06:59:57Z) - ProCIS: A Benchmark for Proactive Retrieval in Conversations [21.23826888841565]
本稿では,280万件以上の会話からなるプロアクティブな文書検索のための大規模データセットを提案する。
クラウドソーシング実験を行い、高品質で比較的完全な妥当性判定を行う。
また、各文書に関連する会話部分に関するアノテーションを収集し、前向きな検索システムの評価を可能にする。
論文 参考訳(メタデータ) (2024-05-10T13:11:07Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - Dialogue Term Extraction using Transfer Learning and Topological Data
Analysis [0.8185867455104834]
我々は、純粋にデータ駆動方式で対話におけるドメイン、スロット、値の認識を可能にするさまざまな機能を探究する。
各特徴セットの有用性を検討するために、広く使われているMultiWOZデータセットに基づいてシードモデルを訓練する。
提案手法は,単語の埋め込みのみに依存する従来の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-22T17:04:04Z) - Personal Entity, Concept, and Named Entity Linking in Conversations [4.759142872591625]
会話におけるエンティティリンクのためのコレクションとツールを紹介します。
我々は、名前付きエンティティ、概念、個人エンティティへのリンクからなる会話発話1327件のELアノテーションを収集する。
このデータセットは、対話型エンティティリンクであるCRELのためのツールキットのトレーニングに使用される。
論文 参考訳(メタデータ) (2022-06-15T22:32:29Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - Improving Conversational Recommender Systems via Knowledge Graph based
Semantic Fusion [77.21442487537139]
対話型レコメンデータシステム(CRS)は,対話型対話を通じて高品質なアイテムをユーザに推薦することを目的としている。
まず、会話データ自体にユーザの好みを正確に理解するための十分なコンテキスト情報がない。
第二に、自然言語表現とアイテムレベルのユーザ嗜好の間には意味的なギャップがある。
論文 参考訳(メタデータ) (2020-07-08T11:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。