論文の概要: Detecting Speaker Personas from Conversational Texts
- arxiv url: http://arxiv.org/abs/2109.01330v1
- Date: Fri, 3 Sep 2021 06:14:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-06 14:01:52.203844
- Title: Detecting Speaker Personas from Conversational Texts
- Title(参考訳): 会話テキストからの話者ペルソナの検出
- Authors: Jia-Chen Gu, Zhen-Hua Ling, Yu Wu, Quan Liu, Zhigang Chen, Xiaodan Zhu
- Abstract要約: 本研究では,平易な会話テキストに基づく話者ペルソナの検出を目的とした,話者ペルソナ検出(SPD)という新しいタスクについて検討する。
我々は、Persona Match on Persona-Chat (PMPC)と呼ばれるSPDのためのデータセットを構築している。
本稿では,複数のベースラインモデルを評価し,この課題に対する発話対注目(U2P)マッチングネットワークを提案する。
- 参考スコア(独自算出の注目度): 52.4557098875992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Personas are useful for dialogue response prediction. However, the personas
used in current studies are pre-defined and hard to obtain before a
conversation. To tackle this issue, we study a new task, named Speaker Persona
Detection (SPD), which aims to detect speaker personas based on the plain
conversational text. In this task, a best-matched persona is searched out from
candidates given the conversational text. This is a many-to-many semantic
matching task because both contexts and personas in SPD are composed of
multiple sentences. The long-term dependency and the dynamic redundancy among
these sentences increase the difficulty of this task. We build a dataset for
SPD, dubbed as Persona Match on Persona-Chat (PMPC). Furthermore, we evaluate
several baseline models and propose utterance-to-profile (U2P) matching
networks for this task. The U2P models operate at a fine granularity which
treat both contexts and personas as sets of multiple sequences. Then, each
sequence pair is scored and an interpretable overall score is obtained for a
context-persona pair through aggregation. Evaluation results show that the U2P
models outperform their baseline counterparts significantly.
- Abstract(参考訳): ペルソナは対話応答予測に有用である。
しかし、現在の研究で使われるペルソナは事前に定義されており、会話の前に入手するのは難しい。
この問題に対処するために,従来の会話文に基づく話者ペルソナの検出を目的とした,spd(speaker persona detection)という新しいタスクについて検討した。
このタスクでは、会話のテキストから最良マッチングされたペルソナを候補から検索する。
spdのコンテキストとペルソナはどちらも複数の文で構成されているため、これは多対多のセマンティックマッチングタスクである。
これらの文の長期的な依存性と動的冗長性は、このタスクの難易度を高める。
我々は,Persona Match on Persona-Chat (PMPC) と呼ばれるSPDのためのデータセットを構築した。
さらに,いくつかのベースラインモデルを評価し,この課題に対する発話対注目(U2P)マッチングネットワークを提案する。
U2Pモデルは、コンテキストとペルソナの両方を複数のシーケンスの集合として扱う微粒度で動作する。
そして、各シーケンスペアをスコアし、アグリゲーションを介してコンテキスト対対に対する解釈可能な総合スコアを得る。
評価の結果,U2Pモデルはベースラインモデルよりも有意に優れていた。
関連論文リスト
- Phrase Retrieval for Open-Domain Conversational Question Answering with
Conversational Dependency Modeling via Contrastive Learning [54.55643652781891]
Open-Domain Conversational Question Answering (ODConvQA)は、マルチターン会話を通じて質問に答えることを目的としている。
そこで本研究では,単語列に対する句検索方式を用いて,回答を直接予測する手法を提案する。
論文 参考訳(メタデータ) (2023-06-07T09:46:38Z) - Speaker Profiling in Multiparty Conversations [31.518453682472575]
本研究では,会話における話者プロファイリング(SPC)の課題について検討する。
SPCの主な目的は、対話に存在する各話者について、ペルソナの特徴の要約を作成することである。
SPCの課題に対処するため、私たちはSPICEという名前の新しいデータセットをキュレートしました。
論文 参考訳(メタデータ) (2023-04-18T08:04:46Z) - When Crowd Meets Persona: Creating a Large-Scale Open-Domain Persona
Dialogue Corpus [13.051107304650627]
自然言語データセットの構築には、単語の意味論が微妙なテキストの変更や注釈付き概念の定義に弱いため、注意が必要である。
本研究では,大規模なオープンドメインペルソナ対話コーパスを作成する際に,これらの課題に対処する。
論文 参考訳(メタデータ) (2023-04-01T16:10:36Z) - Semantic Parsing for Conversational Question Answering over Knowledge
Graphs [63.939700311269156]
本研究では,ユーザの質問にSparqlパースとアノテートし,システム回答が実行結果に対応するデータセットを開発する。
本稿では,2つの意味解析手法を提案し,その課題を強調した。
私たちのデータセットとモデルはhttps://github.com/Edinburgh/SPICE.orgで公開されています。
論文 参考訳(メタデータ) (2023-01-28T14:45:11Z) - A Graph-Based Context-Aware Model to Understand Online Conversations [3.8345539498627437]
オンライン会話では、コメントや返信は、すぐに関連する情報以外の外部のコンテキストに基づいている可能性がある。
グラフウォークを用いて会話のより広いコンテキストを組み込む新しいグラフベースのディープラーニングアーキテクチャであるGraphNLIを提案する。
極性予測と擬似的ヘイトスピーチ検出という2つのタスクでGraphNLIを評価する。
論文 参考訳(メタデータ) (2022-11-16T20:51:45Z) - Question-Interlocutor Scope Realized Graph Modeling over Key Utterances
for Dialogue Reading Comprehension [61.55950233402972]
本稿では,対話読解のためのキーワード抽出手法を提案する。
複数の連続した発話によって形成された単位に対して予測を行い、より多くの回答を含む発話を実現する。
発話のテキスト上に構築されたグラフとして,質問-対話者スコープ実現グラフ(QuISG)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-26T04:00:42Z) - Findings on Conversation Disentanglement [28.874162427052905]
発話から発話への分類と発話からスレッドへの分類を学習する学習モデルを構築した。
Ubuntu IRCデータセットの実験は、このアプローチが従来の欲求的アプローチを上回る可能性があることを示している。
論文 参考訳(メタデータ) (2021-12-10T05:54:48Z) - Rethinking End-to-End Evaluation of Decomposable Tasks: A Case Study on
Spoken Language Understanding [101.24748444126982]
分解可能なタスクは複雑で、サブタスクの階層から構成される。
しかし、既存のベンチマークでは、通常は表面レベルのサブタスクのみの例が示される。
サブタスク固有のユーティリティ関数上の座標アセントを用いて、ロバストなテストセットを構築するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-29T02:53:59Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。