論文の概要: Counterfactual Reasoning Using Predicted Latent Personality Dimensions for Optimizing Persuasion Outcome
- arxiv url: http://arxiv.org/abs/2404.13792v1
- Date: Sun, 21 Apr 2024 23:03:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 15:36:05.720006
- Title: Counterfactual Reasoning Using Predicted Latent Personality Dimensions for Optimizing Persuasion Outcome
- Title(参考訳): パーソナライズアウトの最適化のための予測潜在人格次元を用いた対物推論
- Authors: Donghuo Zeng, Roberto S. Legaspi, Yuewen Sun, Xinshuai Dong, Kazushi Ikeda, Peter Spirtes, kun Zhang,
- Abstract要約: 本稿では,現在進行中の説得会話において,ユーザの潜在人格次元(LPD)を追跡する新しいアプローチを提案する。
我々はこれらのLPDに基づいて、全体的な説得結果を最適化するために、調整済みの対物発話を生成する。
- 参考スコア(独自算出の注目度): 13.731895847081953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Customizing persuasive conversations related to the outcome of interest for specific users achieves better persuasion results. However, existing persuasive conversation systems rely on persuasive strategies and encounter challenges in dynamically adjusting dialogues to suit the evolving states of individual users during interactions. This limitation restricts the system's ability to deliver flexible or dynamic conversations and achieve suboptimal persuasion outcomes. In this paper, we present a novel approach that tracks a user's latent personality dimensions (LPDs) during ongoing persuasion conversation and generates tailored counterfactual utterances based on these LPDs to optimize the overall persuasion outcome. In particular, our proposed method leverages a Bi-directional Generative Adversarial Network (BiCoGAN) in tandem with a Dialogue-based Personality Prediction Regression (DPPR) model to generate counterfactual data. This enables the system to formulate alternative persuasive utterances that are more suited to the user. Subsequently, we utilize the D3QN model to learn policies for optimized selection of system utterances on counterfactual data. Experimental results we obtained from using the PersuasionForGood dataset demonstrate the superiority of our approach over the existing method, BiCoGAN. The cumulative rewards and Q-values produced by our method surpass ground truth benchmarks, showcasing the efficacy of employing counterfactual reasoning and LPDs to optimize reinforcement learning policy in online interactions.
- Abstract(参考訳): 特定のユーザに対する関心の結果に関連する説得的会話をカスタマイズすると、より良い説得結果が得られる。
しかし、既存の説得的会話システムは、対話中の個々のユーザの進化状態に適合する対話を動的に調整する際の説得的戦略と挑戦に頼っている。
この制限は、フレキシブルまたはダイナミックな会話を提供し、最適以下の説得結果を達成するシステムの能力を制限する。
本稿では,現在進行中の説得会話において,ユーザの潜在人格次元(LPD)をトラッキングし,これらのLPDに基づいて適切な対実発話を生成し,全体的な説得結果を最適化する手法を提案する。
特に,本提案手法では,対話型パーソナリティ予測回帰(DPPR)モデルを用いて双方向生成適応ネットワーク(BiCoGAN)をタンデムで利用し,デファクトデータを生成する。
これにより、ユーザがより適した他の説得的発話を定式化することができる。
その後、D3QNモデルを用いて、対実データに基づくシステム発話の選択を最適化するためのポリシーを学習する。
PersuasionForGoodデータセットを用いて得られた実験結果から,既存の手法であるBiCoGANに対するアプローチの優位性を実証した。
提案手法が生み出した累積報酬とQ値が真理ベンチマークを上回り,オンラインインタラクションにおける強化学習政策の最適化に対実的推論とLPDを併用する効果が示された。
関連論文リスト
- Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1240295759264]
本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文 参考訳(メタデータ) (2024-08-14T11:29:47Z) - Enhancing Large Language Model Induced Task-Oriented Dialogue Systems
Through Look-Forward Motivated Goals [76.69419538047813]
ProToDアプローチは、将来の対話行動を予測し、ToDシステムを強化するためにゴール指向の報酬シグナルを組み込む。
本稿では,目標駆動型対話シミュレーションに基づくToDシステム評価手法を提案する。
また,MultiWoZ 2.1データセットを用いた実験により,データの10%しか利用せず,優れた性能が得られることを示した。
論文 参考訳(メタデータ) (2023-09-16T10:56:00Z) - Query-Dependent Prompt Evaluation and Optimization with Offline Inverse
RL [62.824464372594576]
ゼロショットプロンプト最適化により,Large Language Models (LLM) の算術的推論能力を向上させることを目的とする。
このような最適化では、以前見過ごされたクエリ依存の目的を特定します。
本稿では、オフライン逆強化学習を利用して、実演データから洞察を引き出すPrompt-OIRLを紹介する。
論文 参考訳(メタデータ) (2023-09-13T01:12:52Z) - Diverse and Faithful Knowledge-Grounded Dialogue Generation via
Sequential Posterior Inference [82.28542500317445]
本稿では,知識の選択と対話生成が可能な,逐次後推論(Sequential Posterior Inference, SPI)と呼ばれるエンドツーエンド学習フレームワークを提案する。
他の方法とは異なり、SPIは推論ネットワークを必要とせず、後部分布の単純な幾何学を仮定する。
論文 参考訳(メタデータ) (2023-06-01T21:23:13Z) - Which Factors Predict the Chat Experience of a Natural Language
Generation Dialogue Service? [0.0]
自然言語生成ダイアログシステムにおけるチャット体験を予測するための概念モデルを評価する。
対話におけるユーザの好意性と一貫性,感情,類似性は,ユーザのチャット体験の肯定的な予測要因である。
アダプティブダイアログシステムは、収集したデータを用いて、モデル内の因子を推測し、これらの要因を通してユーザのチャット体験を予測し、プロンプトを調整することでそれを最適化する。
論文 参考訳(メタデータ) (2023-04-21T07:29:07Z) - Taming Continuous Posteriors for Latent Variational Dialogue Policies [1.0312968200748118]
我々は,潜在作用RLに対するガウス変分後部を再検討し,分類学よりも優れた性能が得られることを示す。
トレーニング手順を簡素化し、潜伏する対話ポリシーを標準化する方法を提案する。
論文 参考訳(メタデータ) (2022-05-16T12:50:32Z) - Machine Learning for Utility Prediction in Argument-Based Computational
Persuasion [17.214664783818677]
医療などの実際のアプリケーションでは、APSとユーザにとって、対話の結果が同じ、あるいは正反対になる可能性は低い。
ユーザからの情報を活用してユーティリティを予測する2つの機械学習手法を開発した。
本研究は,健康な食生活に関するシミュレーション環境と現実的なケーススタディにおいて,EAIとEDSを評価した。
論文 参考訳(メタデータ) (2021-12-09T14:28:54Z) - Partner Matters! An Empirical Study on Fusing Personas for Personalized
Response Selection in Retrieval-Based Chatbots [51.091235903442715]
本稿では,自己とパートナーの話者が応答選択の課題に与える影響について検討する。
4つのペルソナ融合戦略が設計されており、異なる方法でペルソナがコンテキストや応答と相互作用することを前提としている。
Persona-Chatデータセットに関する実証研究は、パートナーペルソナが応答選択の精度を向上させることができることを示している。
論文 参考訳(メタデータ) (2021-05-19T10:32:30Z) - Strategic Argumentation Dialogues for Persuasion: Framework and
Experiments Based on Modelling the Beliefs and Concerns of the Persuadee [6.091096843566857]
特定の対話において議論が良いかどうかを決定するための2つの重要な次元は、意図する観衆が議論と反論を信じる程度であり、議論が意図する観衆の関心に与える影響である。
本稿では,これらのモデルを用いて,説得的対話における移動の選択を最適化する枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-28T08:49:24Z) - You Impress Me: Dialogue Generation via Mutual Persona Perception [62.89449096369027]
認知科学の研究は、理解が高品質なチャット会話に不可欠なシグナルであることを示唆している。
そこで我々は,P2 Botを提案する。このP2 Botは,理解を明示的にモデル化することを目的とした送信機受信者ベースのフレームワークである。
論文 参考訳(メタデータ) (2020-04-11T12:51:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。