論文の概要: Long-term Control for Dialogue Generation: Methods and Evaluation
- arxiv url: http://arxiv.org/abs/2205.07352v1
- Date: Sun, 15 May 2022 18:33:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-18 03:58:23.664415
- Title: Long-term Control for Dialogue Generation: Methods and Evaluation
- Title(参考訳): 対話生成のための長期制御:方法と評価
- Authors: Ramya Ramakrishnan, Hashan Buddhika Narangodage, Mauro Schilman,
Kilian Q. Weinberger, Ryan McDonald
- Abstract要約: 我々は、よりきめ細かい制御を伴う制約付き長期対話生成に焦点を合わせ、生成した応答に特定の制御語セットが現れる必要がある。
この設定は、これらの制御語の生成を即時に考慮するだけでなく、(おそらく遠い)未来において、ある時点で単語の生成を促進する発話を生成するモデルを必要とする。
本稿では,ロジット修正手法による長期制御生成の性能向上を目的とした検索拡張手法を提案する。
- 参考スコア(独自算出の注目度): 20.889476424750928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current approaches for controlling dialogue response generation are primarily
focused on high-level attributes like style, sentiment, or topic. In this work,
we focus on constrained long-term dialogue generation, which involves more
fine-grained control and requires a given set of control words to appear in
generated responses. This setting requires a model to not only consider the
generation of these control words in the immediate context, but also produce
utterances that will encourage the generation of the words at some time in the
(possibly distant) future. We define the problem of constrained long-term
control for dialogue generation, identify gaps in current methods for
evaluation, and propose new metrics that better measure long-term control. We
also propose a retrieval-augmented method that improves performance of
long-term controlled generation via logit modification techniques. We show
through experiments on three task-oriented dialogue datasets that our metrics
better assess dialogue control relative to current alternatives and that our
method outperforms state-of-the-art constrained generation baselines.
- Abstract(参考訳): 対話応答生成を制御する現在のアプローチは、主にスタイル、感情、トピックといったハイレベルな属性に焦点を当てている。
本研究では,よりきめ細かな制御を伴い,生成された応答に現れる制御語群を必要とする,制約付き長期対話生成に注目した。
この設定は、これらの制御語の生成を即時に考慮するだけでなく、(おそらく遠い)未来において、ある時点で単語の生成を促進する発話を生成するモデルを必要とする。
対話生成のための制約付き長期制御の問題を定義し,評価方法のギャップを特定し,長期制御をよりよく測定する新しい指標を提案する。
また,ロジット修正手法による長期制御生成の性能向上を図った検索拡張手法を提案する。
本研究では,3つのタスク指向対話データセットについて実験を行い,提案手法が現状の制約付き世代ベースラインよりも優れた対話制御性能を示すことを示す。
関連論文リスト
- Unsupervised Extraction of Dialogue Policies from Conversations [3.102576158218633]
本稿では,データセットから対話ポリシーを抽出する上で,Large Language Modelがいかに有効かを示す。
そこで我々は,制御可能かつ解釈可能なグラフベースの手法を用いて対話ポリシーを生成する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-21T14:57:25Z) - Evaluating Very Long-Term Conversational Memory of LLM Agents [95.84027826745609]
我々は,高品質で長期的な対話を生成するための,マシン・ヒューマン・パイプラインを導入する。
我々は、各エージェントに画像の共有と反応の能力を持たせる。
生成した会話は、長距離一貫性のために人間のアノテーションによって検証され、編集される。
論文 参考訳(メタデータ) (2024-02-27T18:42:31Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z) - Target-Guided Dialogue Response Generation Using Commonsense and Data
Augmentation [32.764356638437214]
ターゲット誘導応答生成のための新しい手法を提案する。
また,既存の対話データセットをターゲット誘導生成のために再利用する手法を提案する。
我々の作業は、一般的に、対話システムの設計者が、システムが生み出す会話をより制御できるようにします。
論文 参考訳(メタデータ) (2022-05-19T04:01:40Z) - Controlling Dialogue Generation with Semantic Exemplars [55.460082747572734]
本稿では,経験的応答に現れる意味的フレームを用いて生成をガイドする,経験的対話生成モデルEDGEを提案する。
単語自体の単語ではなく、経験者の意味的フレームに基づく対話生成の制御により、生成した応答の一貫性が向上することを示す。
論文 参考訳(メタデータ) (2020-08-20T17:02:37Z) - Rethinking Dialogue State Tracking with Reasoning [76.0991910623001]
本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。
実験の結果,MultiWOZ 2.1の連立信条精度は38.6%向上した。
論文 参考訳(メタデータ) (2020-05-27T02:05:33Z) - Modeling Long Context for Task-Oriented Dialogue State Generation [51.044300192906995]
本稿では,シンプルで効果的な発話タグ付け手法と双方向言語モデルを用いたマルチタスク学習モデルを提案する。
提案手法は,入力対話コンテキストシーケンスが長い場合に,ベースラインの性能が著しく低下する,という問題を解決する。
本実験では,MultiWOZ 2.0データセットにおいて,ベースラインに対して7.03%の相対的改善を実現し,新しい最先端のジョイントゴール精度を52.04%に設定した。
論文 参考訳(メタデータ) (2020-04-29T11:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。