論文の概要: Effects of Naturalistic Variation in Goal-Oriented Dialog
- arxiv url: http://arxiv.org/abs/2010.02260v1
- Date: Mon, 5 Oct 2020 18:13:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 20:12:03.613806
- Title: Effects of Naturalistic Variation in Goal-Oriented Dialog
- Title(参考訳): ゴール指向ダイアログにおける自然変化の影響
- Authors: Jatin Ganhotra, Robert Moore, Sachindra Joshi and Kahini Wadhawan
- Abstract要約: 本稿では,bAbIダイアログタスクとStanford Multi-Domainデータセットの2つの目標指向データセットに対する自然主義的変動の影響について検討する。
本稿では,ユーザによる自然主義的変動を導入することにより,両方のデータセットに対する新しい,より効果的なテストベッドを提案する。
- 参考スコア(独自算出の注目度): 12.49850843793842
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Existing benchmarks used to evaluate the performance of end-to-end neural
dialog systems lack a key component: natural variation present in human
conversations. Most datasets are constructed through crowdsourcing, where the
crowd workers follow a fixed template of instructions while enacting the role
of a user/agent. This results in straight-forward, somewhat routine, and mostly
trouble-free conversations, as crowd workers do not think to represent the full
range of actions that occur naturally with real users. In this work, we
investigate the impact of naturalistic variation on two goal-oriented datasets:
bAbI dialog task and Stanford Multi-Domain Dataset (SMD). We also propose new
and more effective testbeds for both datasets, by introducing naturalistic
variation by the user. We observe that there is a significant drop in
performance (more than 60% in Ent. F1 on SMD and 85% in per-dialog accuracy on
bAbI task) of recent state-of-the-art end-to-end neural methods such as BossNet
and GLMP on both datasets.
- Abstract(参考訳): エンド・ツー・エンドのニューラルダイアログシステムの性能を評価するための既存のベンチマークには、重要なコンポーネントが欠けている。
ほとんどのデータセットはクラウドソーシングによって構築され、クラウドワーカーはユーザー/エージェントの役割を実行しながら、一定の指示のテンプレートに従う。
この結果、群衆労働者は実際のユーザーにとって自然に起こる行動の全範囲を表現していないため、ストレートフォワード、ややルーチン、そしてほとんどトラブルのない会話をもたらす。
本研究では,bAbIダイアログタスクとStanford Multi-Domain Dataset (SMD) の2つの目標指向データセットに対する自然主義的変動の影響について検討する。
また、ユーザによる自然な変動を導入し、両方のデータセットに対する新しいより効果的なテストベッドを提案する。
両データセットのBossNetやGLMPといった最先端のエンドツーエンドのニューラル手法では,SMDではF1が60%以上,bAbIタスクではダイアログ毎の精度が85%)が著しく低下している。
関連論文リスト
- LLM-assisted Explicit and Implicit Multi-interest Learning Framework for Sequential Recommendation [50.98046887582194]
本研究では,ユーザの興味を2つのレベル – 行動と意味論 – でモデル化する,明示的で暗黙的な多目的学習フレームワークを提案する。
提案するEIMFフレームワークは,小型モデルとLLMを効果的に組み合わせ,多目的モデリングの精度を向上させる。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - MUG: Interactive Multimodal Grounding on User Interfaces [12.035123646959669]
本稿では,ユーザとエージェントがインタフェース画面上で協調作業を行うマルチモーダルグラウンドのための対話型タスクMUGを提案する。
ユーザがコマンドを与え、エージェントがコマンドに応答する。MUGはエージェントの応答を見る際に、エージェントがそのアクションを洗練または修正するための追加コマンドを与えるように、複数のラウンドのインタラクションを可能にする。
論文 参考訳(メタデータ) (2022-09-29T21:08:18Z) - Self-augmented Data Selection for Few-shot Dialogue Generation [18.794770678708637]
我々は,MR-to-Text生成問題に対処するために,自己学習フレームワークを採用する。
我々は,我々の生成モデルが最も不確実なデータを選択するための新しいデータ選択戦略を提案する。
論文 参考訳(メタデータ) (2022-05-19T16:25:50Z) - Dynamic Relation Discovery and Utilization in Multi-Entity Time Series
Forecasting [92.32415130188046]
多くの現実世界のシナリオでは、実体の間に決定的かつ暗黙的な関係が存在する可能性がある。
本稿では,自動グラフ学習(A2GNN)を用いたマルチグラフニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-18T11:37:04Z) - Dual Task Framework for Debiasing Persona-grounded Dialogue Dataset [17.403065663306567]
我々は、ペルソナ条件の対話エージェントを改善するために、データ中心のアプローチを導入する。
具体的には,2つのタスクの原始的双対構造を活用することで,対話データセット/エージェントを改善するための関連するペルソナを強化する。
Persona-Chat の実験により,本手法は訓練済みの LM よりも精度が 11.7 ポイント向上していることが示された。
論文 参考訳(メタデータ) (2022-02-11T04:08:46Z) - Adversarial Deep Feature Extraction Network for User Independent Human
Activity Recognition [4.988898367111902]
本稿では,人間行動認識のための最大平均不一致(MMD)正則化を用いた対向的対象非依存特徴抽出法を提案する。
本手法は,ユーザに依存しない性能を著しく向上し,結果のばらつきを低減できることを示す,よく知られた公開データセット上での評価を行う。
論文 参考訳(メタデータ) (2021-10-23T07:50:32Z) - Partner Matters! An Empirical Study on Fusing Personas for Personalized
Response Selection in Retrieval-Based Chatbots [51.091235903442715]
本稿では,自己とパートナーの話者が応答選択の課題に与える影響について検討する。
4つのペルソナ融合戦略が設計されており、異なる方法でペルソナがコンテキストや応答と相互作用することを前提としている。
Persona-Chatデータセットに関する実証研究は、パートナーペルソナが応答選択の精度を向上させることができることを示している。
論文 参考訳(メタデータ) (2021-05-19T10:32:30Z) - Few-Shot Visual Grounding for Natural Human-Robot Interaction [0.0]
本稿では,人間ユーザによって音声で示される,混み合ったシーンから対象物を分割するソフトウェアアーキテクチャを提案する。
システムのコアでは、視覚的な接地のためにマルチモーダルディープニューラルネットワークを使用します。
公開シーンデータセットから収集した実RGB-Dデータに対して,提案モデルの性能を評価する。
論文 参考訳(メタデータ) (2021-03-17T15:24:02Z) - A Simple Language Model for Task-Oriented Dialogue [61.84084939472287]
SimpleTODはタスク指向対話に対する単純なアプローチであり、すべてのサブタスクのリキャストで訓練された単一因果言語モデルを単一シーケンス予測問題として利用する。
これによりSimpleTODは、事前訓練されたオープンドメイン、GPT-2のような因果言語モデルからのトランスファー学習を完全に活用できる。
論文 参考訳(メタデータ) (2020-05-02T11:09:27Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。