論文の概要: Learning from Implicit User Feedback, Emotions and Demographic Information in Task-Oriented and Document-Grounded Dialogues
- arxiv url: http://arxiv.org/abs/2401.09248v2
- Date: Sat, 09 Nov 2024 13:07:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:04:12.043670
- Title: Learning from Implicit User Feedback, Emotions and Demographic Information in Task-Oriented and Document-Grounded Dialogues
- Title(参考訳): タスク指向・文書型対話における暗黙のユーザフィードバック・感情・デモグラフィック情報からの学習
- Authors: Dominic Petrak, Thy Thy Tran, Iryna Gurevych,
- Abstract要約: FEDIは、この情報に注釈を付けた最初の英語タスク指向および文書地上対話データセットである。
Flan-T5、GPT-2、Llama 2の実験では、タスクの完了と実際の一貫性に特に肯定的な影響が示されている。
- 参考スコア(独自算出の注目度): 52.95506649193427
- License:
- Abstract: Implicit user feedback, user emotions and demographic information have shown to be promising sources for improving the accuracy and user engagement of responses generated by dialogue systems. However, the influence of such information on task completion and factual consistency, which are important criteria for task-oriented and document-grounded dialogues, is not yet known. To address this, we introduce FEDI, the first English task-oriented and document-grounded dialogue dataset annotated with this information. Our experiments with Flan-T5, GPT-2 and Llama 2 show a particularly positive impact on task completion and factual consistency. Participants in our human evaluation reported that the responses generated by the feedback-trained models were more informative (Flan-T5 and GPT-2), relevant and factual consistent (Llama 2).
- Abstract(参考訳): ユーザからのインクルーシブフィードバック,ユーザ感情,人口統計情報は,対話システムによって生成された応答の精度とユーザエンゲージメントを改善するための有望な情報源であることが示されている。
しかし,タスク指向と文書的対話の重要な基準であるタスク完了と事実整合性に対するそのような情報の影響は,まだ分かっていない。
そこで本研究では,この情報を付加した最初の英語タスク指向・文書地上対話データセットであるFEDIを紹介する。
Flan-T5, GPT-2, Llama 2による実験は, タスク完了と現実の整合性に特に肯定的な影響を示した。
ヒト評価の参加者は, フィードバック学習モデルにより生成された反応が, 関連性, 事実整合性(Llama 2), より情報的(Flan-T5, GPT-2)であることが報告された。
関連論文リスト
- Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - $\textit{Dial BeInfo for Faithfulness}$: Improving Factuality of
Information-Seeking Dialogue via Behavioural Fine-Tuning [55.96744451743273]
本稿では,情報探索対話システムを支援する行動調整手法であるBeInfoを紹介する。
私たちは、BeInfoでチューニングされたモデルが、知識ソースにかなり忠実になることを示します。
また、BeInfoで調整された3Bパラメータを持つモデルが実運用時の会話からのデータに対して強い性能を示すことを示す。
論文 参考訳(メタデータ) (2023-11-16T11:25:44Z) - WHAT, WHEN, and HOW to Ground: Designing User Persona-Aware
Conversational Agents for Engaging Dialogue [4.328280329592151]
本稿では,WWH問題に対処するオープンドメイン対話システムを構築する方法を提案する。
提案手法は、重み付けされたデータセットブレンディング、ネガティブなペルソナ情報拡張方法、パーソナライズされた会話データセットの設計を含む。
本研究は,対話の流速と接地傾向のバランスを効果的に保ちつつ,接地応答の制御性と説明性を向上させるための応答型ラベルを導入する。
論文 参考訳(メタデータ) (2023-06-06T02:28:38Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - EVI: Multilingual Spoken Dialogue Tasks and Dataset for Knowledge-Based
Enrolment, Verification, and Identification [49.77911492230467]
3つの認証タスクとその評価プロトコルを形式化する。
EVIは、英語、ポーランド語、フランス語で5,506の対話が可能な、難解な多言語データセットである。
論文 参考訳(メタデータ) (2022-04-28T13:39:24Z) - Dual Task Framework for Debiasing Persona-grounded Dialogue Dataset [17.403065663306567]
我々は、ペルソナ条件の対話エージェントを改善するために、データ中心のアプローチを導入する。
具体的には,2つのタスクの原始的双対構造を活用することで,対話データセット/エージェントを改善するための関連するペルソナを強化する。
Persona-Chat の実験により,本手法は訓練済みの LM よりも精度が 11.7 ポイント向上していることが示された。
論文 参考訳(メタデータ) (2022-02-11T04:08:46Z) - Call for Customized Conversation: Customized Conversation Grounding
Persona and Knowledge [25.378474996192438]
ユーザのペルソナとウィキペディアの知識によって、カスタマイズされた回答が構築される、カスタマイズされた会話データセットのためのコールを導入する。
事前学習した言語モデルの情報的およびカスタマイズされた発話を行う能力を評価する。
論文 参考訳(メタデータ) (2021-12-16T04:44:27Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。