論文の概要: Dialog Policy Learning for Joint Clarification and Active Learning
Queries
- arxiv url: http://arxiv.org/abs/2006.05456v3
- Date: Mon, 14 Dec 2020 03:31:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 13:25:25.489697
- Title: Dialog Policy Learning for Joint Clarification and Active Learning
Queries
- Title(参考訳): 対話政策学習 : 協調的明確化とアクティブ・ラーニング・クェリ
- Authors: Aishwarya Padmakumar and Raymond J. Mooney
- Abstract要約: 我々は階層的な対話ポリシーを訓練し、明確化と活発な学習の両方を共同で行う。
本研究では,これらの機能の一つあるいは両方に対して静的なダイアログポリシーを使用することよりも,対話ポリシーの明確化と能動的学習が効果的であることを示す。
- 参考スコア(独自算出の注目度): 24.420113907842147
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Intelligent systems need to be able to recover from mistakes, resolve
uncertainty, and adapt to novel concepts not seen during training. Dialog
interaction can enable this by the use of clarifications for correction and
resolving uncertainty, and active learning queries to learn new concepts
encountered during operation. Prior work on dialog systems has either focused
on exclusively learning how to perform clarification/ information seeking, or
to perform active learning. In this work, we train a hierarchical dialog policy
to jointly perform both clarification and active learning in the context of an
interactive language-based image retrieval task motivated by an online shopping
application, and demonstrate that jointly learning dialog policies for
clarification and active learning is more effective than the use of static
dialog policies for one or both of these functions.
- Abstract(参考訳): インテリジェントなシステムは、ミスから回復し、不確実性を解決し、トレーニング中に見えない新しい概念に適応する必要がある。
ダイアログインタラクションは、不確かさの修正と解決のための明確化と、運用中に遭遇した新しい概念を学ぶためのアクティブラーニングクエリを使用することで、これを可能にする。
ダイアログシステムに関する以前の作業は、明確化や情報検索の方法のみを学習するか、アクティブな学習を行うことに重点を置いてきた。
本研究では、オンラインショッピングアプリケーションによって動機付けられた対話型言語に基づく画像検索タスクのコンテキストにおいて、階層型ダイアログポリシーを協調的に実行し、それらの機能の一つまたは両方に静的ダイアログポリシーを使用することよりも、協調学習ダイアログポリシーがより効果的であることを実証する。
関連論文リスト
- Few-shot Dialogue Strategy Learning for Motivational Interviewing via Inductive Reasoning [21.078032718892498]
本稿では,ユーザに対して肯定的なライフスタイル変化を取り入れるための対話システム構築の課題について考察する。
専門家によるデモンストレーションから,自然言語帰納規則の形で会話戦略を学習し,適用可能なフレームワークであるDIITを提案する。
論文 参考訳(メタデータ) (2024-03-23T06:03:37Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - Self-Explanation Prompting Improves Dialogue Understanding in Large
Language Models [52.24756457516834]
大規模言語モデル(LLM)の理解能力を高めるための新たな「自己説明(Self-Explanation)」を提案する。
このタスクに依存しないアプローチでは、タスク実行前の各対話発話を分析し、様々な対話中心のタスクのパフォーマンスを向上させる必要がある。
6つのベンチマークデータセットによる実験結果から,本手法は他のゼロショットプロンプトよりも一貫して優れており,数ショットプロンプトの有効性を超えていることが明らかとなった。
論文 参考訳(メタデータ) (2023-09-22T15:41:34Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Utterance Rewriting with Contrastive Learning in Multi-turn Dialogue [22.103162555263143]
比較学習とマルチタスク学習を導入し、問題を共同でモデル化する。
提案手法は,複数の公開データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-22T10:13:27Z) - Hierarchical Inductive Transfer for Continual Dialogue Learning [32.35720663518357]
本稿では,対話スキルを継続的に,かつ効率的に学習し,展開するための階層的帰納的伝達フレームワークを提案する。
唯一のトレーニング可能なモジュールとして、組み込みデバイス上の対話システムが、無視可能な追加パラメータを持つ新しい対話スキルを取得することは有益である。
論文 参考訳(メタデータ) (2022-03-20T08:06:44Z) - Continual Learning in Task-Oriented Dialogue Systems [49.35627673523519]
タスク指向対話システムにおける継続的な学習は、システム全体のリトレーニングのコストを伴わずに、時間を通じて新しいドメインや機能を追加できる。
37ドメインのタスク指向対話システムを4つの設定で継続的に学習するための継続的学習ベンチマークを提案する。
論文 参考訳(メタデータ) (2020-12-31T08:44:25Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z) - Dialog as a Vehicle for Lifelong Learning [24.420113907842147]
本稿では,生涯学習が可能な対話システムを設計する際の問題点について述べる。
この方向への先行作業の例を含み、対処すべき課題について議論する。
論文 参考訳(メタデータ) (2020-06-26T03:08:33Z) - Adaptive Dialog Policy Learning with Hindsight and User Modeling [10.088347529930129]
シミュレーションと実ユーザの両方から,ダイアログエージェントが後見で適応的に学習できるアルゴリズムLHUAを開発した。
実験結果から、LHUAは成功率と政策品質において、文献の競争基準よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2020-05-07T07:43:43Z) - Masking Orchestration: Multi-task Pretraining for Multi-role Dialogue
Representation Learning [50.5572111079898]
マルチロール対話理解は、質問応答、行動分類、対話要約など、幅広い多様なタスクを含む。
対話コーパスは豊富に利用可能であるが、特定の学習タスクのためのラベル付きデータは非常に不足しており、高価である。
本研究では,教師なし事前学習タスクを用いた対話文脈表現学習について検討する。
論文 参考訳(メタデータ) (2020-02-27T04:36:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。