論文の概要: Rating Prediction in Conversational Task Assistants with Behavioral and
Conversational-Flow Features
- arxiv url: http://arxiv.org/abs/2309.11307v1
- Date: Wed, 20 Sep 2023 13:34:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-21 12:46:32.144130
- Title: Rating Prediction in Conversational Task Assistants with Behavioral and
Conversational-Flow Features
- Title(参考訳): 行動・会話フロー特徴を有する会話型タスクアシスタントのレーティング予測
- Authors: Rafael Ferreira, David Semedo and Jo\~ao Magalh\~aes
- Abstract要約: 本稿では,会話フロー機能とユーザ行動機能を組み合わせてユーザ評価を予測するトランスフォーマーモデルTB-Raterを提案する。
特に、Alexa TaskBotチャレンジで収集された実際のヒューマンエージェントの会話とレーティングを使用します。
本結果は,オフライン評価予測のための1つのモデルにおいて,会話の対話フローと行動的側面の両方をモデル化する利点を示す。
- 参考スコア(独自算出の注目度): 6.188306785668896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting the success of Conversational Task Assistants (CTA) can be
critical to understand user behavior and act accordingly. In this paper, we
propose TB-Rater, a Transformer model which combines conversational-flow
features with user behavior features for predicting user ratings in a CTA
scenario. In particular, we use real human-agent conversations and ratings
collected in the Alexa TaskBot challenge, a novel multimodal and multi-turn
conversational context. Our results show the advantages of modeling both the
conversational-flow and behavioral aspects of the conversation in a single
model for offline rating prediction. Additionally, an analysis of the
CTA-specific behavioral features brings insights into this setting and can be
used to bootstrap future systems.
- Abstract(参考訳): 会話型タスクアシスタント(CTA)の成功を予測することは、ユーザの振る舞いを理解し、それに従って行動するために重要である。
本稿では,CTAシナリオにおけるユーザレーティングを予測するために,会話フロー機能とユーザ行動機能を組み合わせたTransformerモデルTB-Raterを提案する。
特に、Alexa TaskBotチャレンジで収集された実際のヒューマンエージェントの会話とレーティングは、新しいマルチモーダルおよびマルチターンの会話コンテキストである。
本結果は,オフライン評価予測のための1つのモデルにおいて,会話の対話フローと行動的側面の両方をモデル化する利点を示す。
さらに、CTA固有の行動特徴の分析は、この設定に洞察をもたらし、将来のシステムのブートストラップに使用できる。
関連論文リスト
- Improving Open-Domain Dialogue Evaluation with a Causal Inference Model [8.625569782672663]
明示的な満足度評価はユーザーから引き出すことができるが、ユーザーは質問された時に評価を提供しないことが多い。
専門家によるポストホック評価は代替案だが、これらは高価で複雑だ。
本稿では,オープンドメイン対話のエキスパート評価とユーザ評価の両方を予測する自動手法の開発について検討する。
論文 参考訳(メタデータ) (2023-01-31T02:31:42Z) - Deploying a Retrieval based Response Model for Task Oriented Dialogues [8.671263996400844]
タスク指向の対話システムは会話能力が高く、状況の変化に容易に適応でき、ビジネス上の制約に適合する必要がある。
本稿では,これらの基準を満たす対話モデルを開発するための3段階の手順について述べる。
論文 参考訳(メタデータ) (2022-10-25T23:10:19Z) - GODEL: Large-Scale Pre-Training for Goal-Directed Dialog [119.1397031992088]
ダイアログのための大規模事前学習言語モデルであるGODELを紹介する。
GODELは、数ショットの微調整設定で、最先端の事前訓練ダイアログモデルより優れていることを示す。
評価手法の新たな特徴は,応答の有用性を評価するユーティリティの概念の導入である。
論文 参考訳(メタデータ) (2022-06-22T18:19:32Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Interacting with Non-Cooperative User: A New Paradigm for Proactive
Dialogue Policy [83.61404191470126]
インタラクティブな環境下でプロアクティブなポリシーを学習できるI-Proという新しいソリューションを提案する。
具体的には,4つの要因からなる学習目標重みを通じてトレードオフを学習する。
実験の結果,I-Proは,有効性と解釈性において,ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-04-07T14:11:31Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - Turn-level Dialog Evaluation with Dialog-level Weak Signals for
Bot-Human Hybrid Customer Service Systems [0.0]
インタラクションの間いつでも、顧客サービスコンタクトにおける成功や価値の複数の側面を定量化する機械学習アプローチを開発しました。
いくつかのアプリケーションにおいて、Amazonのカスタマーサービス品質がどのように改善されているかを示します。
論文 参考訳(メタデータ) (2020-10-25T19:36:23Z) - Adding Chit-Chat to Enhance Task-Oriented Dialogues [36.93917437554091]
Chit-Chatをタスク指向の対話に追加することで、仮想アシスタントの会話をより魅力的でインタラクティブにすることができる。
我々は,2つのタスク指向対話データセットから23.8Kの対話に,新しいチャットベースのアノテーションを提案する。
また,タスク指向対話にChit-chatを追加するための3つの新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-10-24T03:22:43Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z) - BERT-based Ensembles for Modeling Disclosure and Support in
Conversational Social Media Text [9.475039534437332]
本稿では,RoBERTa と ALBERT を用いた文脈適応型単語埋め込みを用いた予測アンサンブルモデルを提案する。
提案手法は,F1スコアにおいて,F1スコアにおいて3%の精度向上を達成し,すべての基準値においてベースモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-01T19:52:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。