論文の概要: Policy-Driven Neural Response Generation for Knowledge-Grounded Dialogue
Systems
- arxiv url: http://arxiv.org/abs/2005.12529v4
- Date: Mon, 24 Aug 2020 21:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 23:20:20.721864
- Title: Policy-Driven Neural Response Generation for Knowledge-Grounded Dialogue
Systems
- Title(参考訳): 知識接地対話システムのためのポリシー駆動ニューラルレスポンス生成
- Authors: Behnam Hedayatnia, Karthik Gopalakrishnan, Seokhwan Kim, Yang Liu,
Mihail Eric, Dilek Hakkani-Tur
- Abstract要約: Seq2seqのニューラルレスポンス生成アプローチは、生成されたレスポンスの内容やスタイルを制御するための明確なメカニズムを持っていない。
本稿では、対話ポリシーを用いて、アクションプランの形式でターゲット応答の内容とスタイルを計画する。
文レベルで動作させる基本対話ポリシーは,ターンレベル生成よりも応答性がよいことを示す。
- 参考スコア(独自算出の注目度): 18.375851346138155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-domain dialogue systems aim to generate relevant, informative and
engaging responses. Seq2seq neural response generation approaches do not have
explicit mechanisms to control the content or style of the generated response,
and frequently result in uninformative utterances. In this paper, we propose
using a dialogue policy to plan the content and style of target responses in
the form of an action plan, which includes knowledge sentences related to the
dialogue context, targeted dialogue acts, topic information, etc. The
attributes within the action plan are obtained by automatically annotating the
publicly released Topical-Chat dataset. We condition neural response generators
on the action plan which is then realized as target utterances at the turn and
sentence levels. We also investigate different dialogue policy models to
predict an action plan given the dialogue context. Through automated and human
evaluation, we measure the appropriateness of the generated responses and check
if the generation models indeed learn to realize the given action plans. We
demonstrate that a basic dialogue policy that operates at the sentence level
generates better responses in comparison to turn level generation as well as
baseline models with no action plan. Additionally the basic dialogue policy has
the added effect of controllability.
- Abstract(参考訳): オープンドメイン対話システムは、関連性があり、情報的かつ魅力的な応答を生成することを目的としている。
seq2seqニューラルレスポンス生成アプローチは、生成された応答の内容やスタイルを制御する明示的なメカニズムを持っておらず、しばしば不規則な発話を引き起こす。
本稿では,対話のコンテキスト,対象の対話行為,話題情報などに関連する知識文を含むアクションプランの形式で,対話ポリシーを用いてターゲット応答の内容とスタイルを計画する。
アクションプラン内の属性は、公開されたトピックチャットデータセットに自動アノテートすることで得られる。
行動計画において,ターンと文レベルで目標発話として実現されるニューラル応答生成器を条件とする。
また,対話の文脈に応じて行動計画を予測するための異なる対話政策モデルについて検討した。
自動および人的評価により、生成した応答の適切性を測定し、生成モデルが実際に与えられた行動計画を実現することを学んでいるかどうかを確認する。
文レベルで動作する基本対話ポリシーは,ターンレベルの生成と,アクションプランのないベースラインモデルに対して,より優れた応答を生成することを実証する。
さらに、基本的な対話政策には制御可能性の付加効果がある。
関連論文リスト
- Target-constrained Bidirectional Planning for Generation of
Target-oriented Proactive Dialogue [11.338393954848632]
ターゲット指向対話生成のための効果的な対話計画に着目する。
認知科学における意思決定理論に着想を得て,新たな目標制約型双方向計画手法を提案する。
我々のアルゴリズムは、様々なベースラインモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-10T02:14:24Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - Prompting and Evaluating Large Language Models for Proactive Dialogues:
Clarification, Target-guided, and Non-collaboration [72.04629217161656]
本研究は, 明瞭化, 目標誘導, 非協調対話の3つの側面に焦点をあてる。
LLMの能動性を高めるために,プロアクティブ・チェーン・オブ・ソート・プロンプト方式を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:49:35Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - Dialog-to-Actions: Building Task-Oriented Dialogue System via
Action-Level Generation [7.110201160927713]
本稿では,アクションレベル生成によるタスク指向対話システムを提案する。
具体的には、まず大規模な対話から対話行動を構築し、対話行動のシーケンスとして各自然言語(NL)応答を表現する。
本研究では,対話履歴を入力とし,対話行動のシーケンスを出力するシーケンス・ツー・シーケンスモデルを訓練する。
論文 参考訳(メタデータ) (2023-04-03T11:09:20Z) - PK-Chat: Pointer Network Guided Knowledge Driven Generative Dialogue
Model [79.64376762489164]
PK-Chatは、知識グラフ上のポインタネットワークと、事前訓練された言語モデルを組み合わせた、ポインタネットワーク誘導生成対話モデルである。
PK-Chatが対話で生成した単語は、単語リストの予測と外部知識グラフ知識の直接予測から導かれる。
PK-Chatに基づく対話システムは、地球科学の学術シナリオ向けに構築されている。
論文 参考訳(メタデータ) (2023-04-02T18:23:13Z) - Target-Guided Dialogue Response Generation Using Commonsense and Data
Augmentation [32.764356638437214]
ターゲット誘導応答生成のための新しい手法を提案する。
また,既存の対話データセットをターゲット誘導生成のために再利用する手法を提案する。
我々の作業は、一般的に、対話システムの設計者が、システムが生み出す会話をより制御できるようにします。
論文 参考訳(メタデータ) (2022-05-19T04:01:40Z) - Controlling Dialogue Generation with Semantic Exemplars [55.460082747572734]
本稿では,経験的応答に現れる意味的フレームを用いて生成をガイドする,経験的対話生成モデルEDGEを提案する。
単語自体の単語ではなく、経験者の意味的フレームに基づく対話生成の制御により、生成した応答の一貫性が向上することを示す。
論文 参考訳(メタデータ) (2020-08-20T17:02:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。