論文の概要: A Survey on Dialog Management: Recent Advances and Challenges
- arxiv url: http://arxiv.org/abs/2005.02233v3
- Date: Mon, 25 Oct 2021 11:12:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 13:57:59.820684
- Title: A Survey on Dialog Management: Recent Advances and Challenges
- Title(参考訳): ダイアログ管理に関する調査 : 最近の進歩と課題
- Authors: Yinpei Dai, Huihua Yu, Yixuan Jiang, Chengguang Tang, Yongbin Li, Jian
Sun
- Abstract要約: ダイアログ管理(DM)はタスク指向ダイアログシステムにおいて重要なコンポーネントである。
1)新しいシナリオにおけるダイアログシステムモデリングを容易にするためのモデルスケーラビリティの改善,(2)ダイアログポリシー学習におけるデータ不足問題への対処,(3)タスク補完性能を向上させるためのトレーニング効率の向上。
- 参考スコア(独自算出の注目度): 72.52920723074638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dialog management (DM) is a crucial component in a task-oriented dialog
system. Given the dialog history, DM predicts the dialog state and decides the
next action that the dialog agent should take. Recently, dialog policy learning
has been widely formulated as a Reinforcement Learning (RL) problem, and more
works focus on the applicability of DM. In this paper, we survey recent
advances and challenges within three critical topics for DM: (1) improving
model scalability to facilitate dialog system modeling in new scenarios, (2)
dealing with the data scarcity problem for dialog policy learning, and (3)
enhancing the training efficiency to achieve better task-completion performance
. We believe that this survey can shed a light on future research in dialog
management.
- Abstract(参考訳): ダイアログ管理(DM)はタスク指向ダイアログシステムにおいて重要なコンポーネントである。
ダイアログ履歴を考えると、dmはダイアログ状態を予測し、ダイアログエージェントがとるべき次のアクションを決定する。
近年、ダイアログポリシー学習は強化学習(RL)問題として広く定式化され、DMの適用性に焦点が当てられている。
本稿では,1)新しいシナリオにおけるダイアログシステムモデリングを容易にするためのモデルスケーラビリティの改善,(2)ダイアログポリシー学習におけるデータ不足問題への対処,(3)タスク補完性能向上のためのトレーニング効率の向上,の3つの重要なトピックにおける最近の進歩と課題について調査する。
本調査は今後のダイアログ管理研究に光を当てることができると考えている。
関連論文リスト
- Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - A Mixture-of-Expert Approach to RL-based Dialogue Management [56.08449336469477]
我々は、強化学習を用いて、近視性(一般的な発話の出力)を回避し、全体的なユーザ満足度を最大化する対話エージェントを開発する。
既存のRLアプローチのほとんどは、単語レベルでエージェントを訓練するので、中規模の語彙であっても、非常に複雑なアクション空間を扱う必要がある。
i)会話履歴の多様な意味を学習できるLMと、(ii)対応する発話を生成できる専門的なLM(または専門家)からなる、新しい専門家言語モデル(MoE-LM)を用いたRLベースのDMを開発する。
論文 参考訳(メタデータ) (2022-05-31T19:00:41Z) - "Think Before You Speak": Improving Multi-Action Dialog Policy by
Planning Single-Action Dialogs [33.78889030078026]
マルチアクションダイアログポリシー(MADP)は、ターンごとに複数のアトミックダイアログアクションを生成する。
シングルアクションダイアログダイナミクスを学習する新しいマルチタスク学習フレームワークであるPlanning Enhanced Dialog Policy (PEDP)を提案する。
完全教師付き学習ベース手法は, タスク成功率90.6%を達成し, 最先端の手法に比べて3%向上した。
論文 参考訳(メタデータ) (2022-04-25T07:55:53Z) - A Survey on Recent Advances and Challenges in Reinforcement
LearningMethods for Task-Oriented Dialogue Policy Learning [16.545577313042827]
強化学習(Reinforcement Learning, RL)は、ユーザが環境として、システムがエージェントとして、対話ポリシーを学ぶために一般的に選択される。
本稿では,RLの規範に基づく対話政策の最近の進歩と課題について調査する。
本稿では,最新の手法をRLの基本要素に分類することで,対話政策学習にRLを適用するための総合的な調査を行う。
論文 参考訳(メタデータ) (2022-02-28T10:50:22Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - Integrating Pre-trained Model into Rule-based Dialogue Management [32.90885176553305]
ルールベースの対話管理は、まだ産業用タスク指向対話システムのための最も人気のあるソリューションです。
データ駆動対話システム(通常はエンドツーエンド構造)は学術研究で人気がある。
本稿ではルールベースとデータ駆動型ダイアログマネージャの長所を活用する手法を提案する。
論文 参考訳(メタデータ) (2021-02-17T03:44:22Z) - Distributed Structured Actor-Critic Reinforcement Learning for Universal
Dialogue Management [29.57382819573169]
我々は,ユーザに対応する対話行動を選択するポリシーの策定に重点を置いている。
逐次的なシステム決定プロセスは、部分的に観察可能なマルコフ決定プロセスに抽象化することができる。
過去数年間、ニューラルネットワーク(NN)を関数近似器として利用するディープ強化学習(DRL)アルゴリズムが数多く存在する。
論文 参考訳(メタデータ) (2020-09-22T05:39:31Z) - Rethinking Dialogue State Tracking with Reasoning [76.0991910623001]
本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。
実験の結果,MultiWOZ 2.1の連立信条精度は38.6%向上した。
論文 参考訳(メタデータ) (2020-05-27T02:05:33Z) - Recent Advances and Challenges in Task-oriented Dialog System [63.82055978899631]
課題指向対話システムは、学術・産業社会でますます注目を集めている。
タスク指向ダイアログシステムにおける3つの重要なトピックについて論じる。(1)低リソース環境でのダイアログモデリングを容易にするデータ効率の改善、(2)ダイアログポリシー学習のためのマルチターンダイナミクスのモデリング、(3)ダイアログモデルへのドメイン知識の統合。
論文 参考訳(メタデータ) (2020-03-17T01:34:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。