論文の概要: A Unified Approach to Entity-Centric Context Tracking in Social
Conversations
- arxiv url: http://arxiv.org/abs/2201.12409v1
- Date: Fri, 28 Jan 2022 20:38:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-05 06:36:19.113845
- Title: A Unified Approach to Entity-Centric Context Tracking in Social
Conversations
- Title(参考訳): 社会会話におけるエンティティ中心コンテキスト追跡への統一的アプローチ
- Authors: Ulrich R\"uckert, Srinivas Sunkara, Abhinav Rastogi, Sushant Prakash,
Pranav Khaitan
- Abstract要約: 人間と人間の会話において、コンテキストトラッキングは重要な実体を特定し、それらの性質と関係を追跡する。
Contrackは、人間と人間の大規模会話コーパスで、コンテキストトラッキングと位置アノテーションを提供する。
コンテキストトラッキングのためのニューラルネットワークアーキテクチャをオープンソースとして公開しています。
- 参考スコア(独自算出の注目度): 6.0969408858730985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In human-human conversations, Context Tracking deals with identifying
important entities and keeping track of their properties and relationships.
This is a challenging problem that encompasses several subtasks such as slot
tagging, coreference resolution, resolving plural mentions and entity linking.
We approach this problem as an end-to-end modeling task where the
conversational context is represented by an entity repository containing the
entity references mentioned so far, their properties and the relationships
between them. The repository is updated turn-by-turn, thus making training and
inference computationally efficient even for long conversations. This paper
lays the groundwork for an investigation of this framework in two ways. First,
we release Contrack, a large scale human-human conversation corpus for context
tracking with people and location annotations. It contains over 7000
conversations with an average of 11.8 turns, 5.8 entities and 15.2 references
per conversation. Second, we open-source a neural network architecture for
context tracking. Finally we compare this network to state-of-the-art
approaches for the subtasks it subsumes and report results on the involved
tradeoffs.
- Abstract(参考訳): 人間と人間の会話では、コンテキストトラッキングは重要なエンティティを識別し、その特性と関係を追跡する。
これはスロットタグ、コア参照解決、複数の参照の解決、エンティティリンクなど、いくつかのサブタスクを含む難しい問題である。
本稿では,これまで述べたエンティティ参照,それらの特性,それらの関係を含むエンティティリポジトリによって,会話コンテキストを表現したエンドツーエンドモデリングタスクとして,この問題にアプローチする。
リポジトリはターンバイターンで更新されるため、長い会話であっても、トレーニングと推論が計算的に効率的になる。
本稿は,この枠組みを2つの方法で検討するための基礎研究を行う。
まず、人間と位置アノテーションによるコンテキスト追跡のための、大規模な人間と人間の会話コーパスであるcontrackをリリースする。
平均11.8ターン、5.8エンティティ、15.2参照を持つ7000以上の会話を含んでいる。
次に、コンテキストトラッキングのためのニューラルネットワークアーキテクチャをオープンソース化します。
最後に、このネットワークをサブタスクの最先端のアプローチと比較し、関連するトレードオフに関する結果を報告します。
関連論文リスト
- DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Conversational Semantic Parsing using Dynamic Context Graphs [68.72121830563906]
汎用知識グラフ(KG)を用いた会話意味解析の課題を,数百万のエンティティと数千のリレーショナルタイプで検討する。
ユーザ発話を実行可能な論理形式にインタラクティブにマッピングできるモデルに焦点を当てる。
論文 参考訳(メタデータ) (2023-05-04T16:04:41Z) - When Crowd Meets Persona: Creating a Large-Scale Open-Domain Persona
Dialogue Corpus [13.051107304650627]
自然言語データセットの構築には、単語の意味論が微妙なテキストの変更や注釈付き概念の定義に弱いため、注意が必要である。
本研究では,大規模なオープンドメインペルソナ対話コーパスを作成する際に,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-01T16:10:36Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - TANet: Thread-Aware Pretraining for Abstractive Conversational
Summarization [27.185068253347257]
我々はRedditコミュニティの複数人による議論に基づいて,RCSと呼ばれる大規模(11M)事前学習データセットを構築した。
次に、スレッド対応のTransformerベースのネットワークであるTANetを紹介する。
会話を文の列として扱う既存の事前学習モデルとは異なり、本質的な文脈依存は会話全体を理解する上で重要な役割を担っていると論じる。
論文 参考訳(メタデータ) (2022-04-09T16:08:46Z) - Training Conversational Agents with Generative Conversational Networks [74.9941330874663]
我々は、生成会話ネットワークを使用して、自動的にデータを生成し、社会的会話エージェントを訓練する。
自動メトリクスと人的評価器を用いてTopicalChatのアプローチを評価し、10%のシードデータで100%のデータを使用するベースラインに近いパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-10-15T21:46:39Z) - Disentangling Online Chats with DAG-Structured LSTMs [55.33014148383343]
DAG-LSTMはTree-LSTMの一般化であり、間接的な非循環的依存関係を処理できる。
提案する新モデルでは,リプライ・トゥ・リレーション(Repend-to-Relation)を回復する作業において,アート・ステータスの状態を達成できることが示される。
論文 参考訳(メタデータ) (2021-06-16T18:00:00Z) - MOLEMAN: Mention-Only Linking of Entities with a Mention Annotation
Network [31.65990156182273]
本稿では、エンティティリンクに対して、インスタンスベースの近接アプローチを提案する。
我々は、同じ実体の類似した言及を、異なる実体の言及よりもベクトル空間に近づけることを学ぶ、文脈化された参照エンコーダを構築する。
本モデルは,ウィキペディアのハイパーリンクから派生した参照ペアの多言語コーパスに基づいて学習し,約7億の参照のインデックス上で最寄りの推測を行う。
論文 参考訳(メタデータ) (2021-06-02T15:54:36Z) - Conversational Entity Linking: Problem Definition and Datasets [21.472928615684985]
対話システムのためのエンティティリンクの研究を行う。
既存の会話データセットから多数の対話を分析し、クラウドソーシングを用いて概念、名前付きエンティティ、個人エンティティへの注釈を付ける。
Conversational Entity LinkingデータセットであるConEL上での従来のELシステムのパフォーマンスを報告し、会話設定によく適合するこれらのメソッドの拡張を提示します。
論文 参考訳(メタデータ) (2021-05-11T09:44:27Z) - Context Dependent Semantic Parsing: A Survey [56.69006903481575]
意味解析は、自然言語の発話を機械可読な意味表現に変換するタスクである。
現在、ほとんどの意味解析手法は文脈情報を利用することができない。
この問題に対処するため、コンテキスト依存のセマンティック解析が最近多くの注目を集めている。
論文 参考訳(メタデータ) (2020-11-02T07:51:05Z) - Conversational Question Answering over Passages by Leveraging Word
Proximity Networks [33.59664244897881]
CROWNは、経路応答を持つ会話型QAのための教師なしかつ効果的なシステムである。
複数のターンにまたがる複数のコンテキストの伝搬をサポートする。
CROWNはTREC CAsTデータで評価され、ニューラルネットワークのプールにおいて上述の性能を達成した。
論文 参考訳(メタデータ) (2020-04-27T19:30:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。