論文の概要: Show Us the Way: Learning to Manage Dialog from Demonstrations
- arxiv url: http://arxiv.org/abs/2004.08114v1
- Date: Fri, 17 Apr 2020 08:41:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 10:07:56.537000
- Title: Show Us the Way: Learning to Manage Dialog from Demonstrations
- Title(参考訳): Show Us the Way: デモからダイアログを学習する
- Authors: Gabriel Gordon-Hall, Philip John Gorinski, Gerasimos Lampouras,
Ignacio Iacobacci
- Abstract要約: 本稿では,第8回ダイアログ・システム・チャレンジにおけるエンド・ツー・エンドマルチドメイン・ダイアログ・チャレンジ・トラックについて紹介する。
提案するダイアログシステムは,自然言語理解,対話状態追跡,対話管理,自然言語生成などの異なるコンポーネントを備えたパイプラインアーキテクチャを採用している。
システムの中心となるのは,Demonstrations からの深層Q-learning を用いて,専門家の助けを借りてダイアログポリシーを学習する強化学習アルゴリズムである。
- 参考スコア(独自算出の注目度): 20.770386771370347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present our submission to the End-to-End Multi-Domain Dialog Challenge
Track of the Eighth Dialog System Technology Challenge. Our proposed dialog
system adopts a pipeline architecture, with distinct components for Natural
Language Understanding, Dialog State Tracking, Dialog Management and Natural
Language Generation. At the core of our system is a reinforcement learning
algorithm which uses Deep Q-learning from Demonstrations to learn a dialog
policy with the help of expert examples. We find that demonstrations are
essential to training an accurate dialog policy where both state and action
spaces are large. Evaluation of our Dialog Management component shows that our
approach is effective - beating supervised and reinforcement learning
baselines.
- Abstract(参考訳): 本稿では,第8回ダイアログ・システム・テクノロジ・チャレンジのエンドツーエンドマルチドメイン・ダイアログ・チャレンジ・トラックに提案する。
提案するダイアログシステムは,自然言語理解,対話状態追跡,ダイアログ管理,自然言語生成などの異なるコンポーネントを備えたパイプラインアーキテクチャを採用している。
システムの中心となるのは,Demonstrations からの深層Q-learning を用いて,専門家の助けを借りてダイアログポリシーを学習する強化学習アルゴリズムである。
状態空間と行動空間の両方が大きい正確なダイアログポリシーのトレーニングには,デモが不可欠であることがわかった。
我々のダイアログ管理コンポーネントの評価は、我々のアプローチが効果的であることを示している。
関連論文リスト
- OmniDialog: An Omnipotent Pre-training Model for Task-Oriented Dialogue
System [43.92593448255296]
我々はOmnipotent Dialogue pre-training model(OmniDialog)を提案する。
3つの対話タスクをマルチタスク学習によってモノリシックなフレームワークに統合し、タスク間通信を促進する。
対話の要約、エンドツーエンドの対話モデリング、対話状態追跡、意図分類の4つのタスクでその性能を評価する。
論文 参考訳(メタデータ) (2023-12-28T07:20:49Z) - Dialog-to-Actions: Building Task-Oriented Dialogue System via
Action-Level Generation [7.110201160927713]
本稿では,アクションレベル生成によるタスク指向対話システムを提案する。
具体的には、まず大規模な対話から対話行動を構築し、対話行動のシーケンスとして各自然言語(NL)応答を表現する。
本研究では,対話履歴を入力とし,対話行動のシーケンスを出力するシーケンス・ツー・シーケンスモデルを訓練する。
論文 参考訳(メタデータ) (2023-04-03T11:09:20Z) - PK-Chat: Pointer Network Guided Knowledge Driven Generative Dialogue
Model [79.64376762489164]
PK-Chatは、知識グラフ上のポインタネットワークと、事前訓練された言語モデルを組み合わせた、ポインタネットワーク誘導生成対話モデルである。
PK-Chatが対話で生成した単語は、単語リストの予測と外部知識グラフ知識の直接予測から導かれる。
PK-Chatに基づく対話システムは、地球科学の学術シナリオ向けに構築されている。
論文 参考訳(メタデータ) (2023-04-02T18:23:13Z) - Structure Extraction in Task-Oriented Dialogues with Slot Clustering [94.27806592467537]
タスク指向対話では、対話構造はしばしば対話状態間の遷移グラフと見なされている。
本稿では,タスク指向対話における構造抽出のための簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T20:18:12Z) - DSBERT:Unsupervised Dialogue Structure learning with BERT [4.171523157658394]
本稿では,Bert を用いた教師なし対話構造学習アルゴリズム DSBERT (Dialogue Structure BERT) を提案する。
従来のSOTAモデルであるVRNNとSVRNNとは異なり、BERTとAutoEncoderを組み合わせることで、コンテキスト情報を効果的に組み合わせることができる。
実験の結果,DSBERTは実構造に近い対話構造を生成でき,意味の異なる文を識別し,異なる隠れ状態にマッピングすることができることがわかった。
論文 参考訳(メタデータ) (2021-11-09T03:31:18Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - Integrating Pre-trained Model into Rule-based Dialogue Management [32.90885176553305]
ルールベースの対話管理は、まだ産業用タスク指向対話システムのための最も人気のあるソリューションです。
データ駆動対話システム(通常はエンドツーエンド構造)は学術研究で人気がある。
本稿ではルールベースとデータ駆動型ダイアログマネージャの長所を活用する手法を提案する。
論文 参考訳(メタデータ) (2021-02-17T03:44:22Z) - Distributed Structured Actor-Critic Reinforcement Learning for Universal
Dialogue Management [29.57382819573169]
我々は,ユーザに対応する対話行動を選択するポリシーの策定に重点を置いている。
逐次的なシステム決定プロセスは、部分的に観察可能なマルコフ決定プロセスに抽象化することができる。
過去数年間、ニューラルネットワーク(NN)を関数近似器として利用するディープ強化学習(DRL)アルゴリズムが数多く存在する。
論文 参考訳(メタデータ) (2020-09-22T05:39:31Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z) - Conversation Learner -- A Machine Teaching Tool for Building Dialog
Managers for Task-Oriented Dialog Systems [57.082447660944965]
Conversation Learnerは、ダイアログマネージャを構築するための機械学習ツールである。
ダイアログ作成者が慣れ親しんだツールを使ってダイアログフローを作成し、ダイアログフローをパラメトリックモデルに変換することができる。
ユーザシステムダイアログをトレーニングデータとして活用することで、ダイアログ作成者が時間とともにダイアログマネージャを改善することができる。
論文 参考訳(メタデータ) (2020-04-09T00:10:54Z) - Recent Advances and Challenges in Task-oriented Dialog System [63.82055978899631]
課題指向対話システムは、学術・産業社会でますます注目を集めている。
タスク指向ダイアログシステムにおける3つの重要なトピックについて論じる。(1)低リソース環境でのダイアログモデリングを容易にするデータ効率の改善、(2)ダイアログポリシー学習のためのマルチターンダイナミクスのモデリング、(3)ダイアログモデルへのドメイン知識の統合。
論文 参考訳(メタデータ) (2020-03-17T01:34:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。