論文の概要: Strength Lies in Differences! Towards Effective Non-collaborative Dialogues via Tailored Strategy Planning
- arxiv url: http://arxiv.org/abs/2403.06769v2
- Date: Tue, 7 May 2024 02:14:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 19:13:23.610482
- Title: Strength Lies in Differences! Towards Effective Non-collaborative Dialogues via Tailored Strategy Planning
- Title(参考訳): 台詞戦略計画による効果的な非協調対話に向けて
- Authors: Tong Zhang, Chen Huang, Yang Deng, Hongru Liang, Jia Liu, Zujie Wen, Wenqiang Lei, Tat-Seng Chua,
- Abstract要約: 本研究では,多様なユーザとの戦略的対話に携わる非協力的対話エージェントについて検討する。
これは既存の対話エージェントに2つの大きな課題をもたらす。
本稿では,ユーザ認識型戦略計画モジュールと人口ベーストレーニングパラダイムを取り入れた,適切な戦略計画の能力を高めるためのTripを提案する。
- 参考スコア(独自算出の注目度): 69.5677514160986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate non-collaborative dialogue agents, which are expected to engage in strategic conversations with diverse users, for securing a mutual agreement that leans favorably towards the system's objectives. This poses two main challenges for existing dialogue agents: 1) The inability to integrate user-specific characteristics into the strategic planning, and 2) The difficulty of training strategic planners that can be generalized to diverse users. To address these challenges, we propose Trip to enhance the capability in tailored strategic planning, incorporating a user-aware strategic planning module and a population-based training paradigm. Through experiments on benchmark non-collaborative dialogue tasks, we demonstrate the effectiveness of Trip in catering to diverse users.
- Abstract(参考訳): 我々は,多様なユーザとの戦略的対話を期待する非協力的対話エージェントについて,システム目標に好意的に依存する相互合意を確保するために検討する。
これは、既存の対話エージェントに2つの大きな課題をもたらす。
1) ユーザ固有の特徴を戦略的計画に組み込むことができないこと、及び
2)多様な利用者に一般化できる戦略プランナーの育成が困難である。
これらの課題に対処するため,我々は,ユーザ対応戦略計画モジュールと人口ベーストレーニングパラダイムを取り入れた,適切な戦略計画の能力を高めるためのTripを提案する。
協調的でない対話タスクのベンチマーク実験を通じて,多様なユーザを対象としたTripの有効性を実証した。
関連論文リスト
- Planning Like Human: A Dual-process Framework for Dialogue Planning [31.995557540062553]
大規模言語モデル(LLM)における対話計画を強化するための2段階対話計画フレームワークを提案する。
心理学における二重過程理論に触発されて、直感的(高速)と分析的(スロー)の2つの思考様式を具現化した枠組みを提案する。
実験により,DPDPが高品質な対話と操作効率を両立し,既存手法よりも優れていることを確認した。
論文 参考訳(メタデータ) (2024-06-08T06:52:47Z) - Target-constrained Bidirectional Planning for Generation of
Target-oriented Proactive Dialogue [11.338393954848632]
ターゲット指向対話生成のための効果的な対話計画に着目する。
認知科学における意思決定理論に着想を得て,新たな目標制約型双方向計画手法を提案する。
我々のアルゴリズムは、様々なベースラインモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2024-03-10T02:14:24Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - Self-Explanation Prompting Improves Dialogue Understanding in Large
Language Models [52.24756457516834]
大規模言語モデル(LLM)の理解能力を高めるための新たな「自己説明(Self-Explanation)」を提案する。
このタスクに依存しないアプローチでは、タスク実行前の各対話発話を分析し、様々な対話中心のタスクのパフォーマンスを向上させる必要がある。
6つのベンチマークデータセットによる実験結果から,本手法は他のゼロショットプロンプトよりも一貫して優れており,数ショットプロンプトの有効性を超えていることが明らかとなった。
論文 参考訳(メタデータ) (2023-09-22T15:41:34Z) - Investigating Reinforcement Learning for Communication Strategies in a
Task-Initiative Setting [8.680676599607123]
我々は,ユーザ明確化戦略の関数として,最初のプレゼンテーションとその後のフォローアップのトレードオフを分析する。
我々は、最小限のデータ要求、説明可能な選択、強力な監査機能をもたらす対話戦略の一貫性に基づく表現に対する驚くべき優位性を見出した。
論文 参考訳(メタデータ) (2023-08-03T00:10:23Z) - Decision-Oriented Dialogue for Human-AI Collaboration [62.367222979251444]
そこでは,大規模言語モデル(LM)のようなAIアシスタントが,自然言語を介して複数の人間と協調して複雑な意思決定を行うための,意思決定指向対話と呼ばれるタスクのクラスについて述べる。
日常的な意思決定に直面する3つの領域を定式化し,(1)レビュアーの会議論文への課題の選択,(2)都市における複数段階の旅程の計画,(3)友人集団の旅行計画の交渉を行う。
各タスクに対して、エージェントが到達した最終決定の質に基づいて報酬を受け取る対話環境を構築する。
論文 参考訳(メタデータ) (2023-05-31T17:50:02Z) - A Survey on Proactive Dialogue Systems: Problems, Methods, and Prospects [100.75759050696355]
本稿では,対話エージェントの多種多様な対話における能動性に関する顕著な問題と先進的な設計について概説する。
我々は、現実世界のアプリケーションのニーズを満たすが、将来もっと研究に焦点を当てる必要がある課題について議論する。
論文 参考訳(メタデータ) (2023-05-04T11:38:49Z) - Improving Multi-turn Emotional Support Dialogue Generation with
Lookahead Strategy Planning [81.79431311952656]
感情支援のための新しいシステムMultiESCを提案する。
戦略プランニングでは,特定の戦略を使用した後のユーザフィードバックを見積もるルックアヘッドを提案する。
ユーザ状態モデリングにおいて、MultiESCはユーザーの微妙な感情表現を捉え、感情の原因を理解することに重点を置いている。
論文 参考訳(メタデータ) (2022-10-09T12:23:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。