論文の概要: Enhancing User Engagement in Socially-Driven Dialogue through Interactive LLM Alignments
- arxiv url: http://arxiv.org/abs/2506.21497v1
- Date: Thu, 26 Jun 2025 17:26:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.214608
- Title: Enhancing User Engagement in Socially-Driven Dialogue through Interactive LLM Alignments
- Title(参考訳): 対話型LLMアライメントによるソーシャル駆動対話におけるユーザエンゲージメント向上
- Authors: Jiashuo Wang, Kaitao Song, Chunpu Xu, Changhe Song, Yang Xiao, Dongsheng Li, Lili Qiu, Wenjie Li,
- Abstract要約: 対話を通じてユーザエンゲージメントを高めることは、社会主導の対話において重要な役割を担います。
対話型LLMは,対話の今後の発展のシグナルを活用することで,ユーザエンゲージメントを学習することができる。
対話型LLMにおけるユーザエンゲージメントを効果的に向上することを示す。
- 参考スコア(独自算出の注目度): 36.632855175566746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enhancing user engagement through interactions plays an essential role in socially-driven dialogues. While prior works have optimized models to reason over relevant knowledge or plan a dialogue act flow, the relationship between user engagement and knowledge or dialogue acts is subtle and does not guarantee user engagement in socially-driven dialogues. To this end, we enable interactive LLMs to learn user engagement by leveraging signals from the future development of conversations. Specifically, we adopt a more direct and relevant indicator of user engagement, i.e., the user's reaction related to dialogue intention after the interaction, as a reward to align interactive LLMs. To achieve this, we develop a user simulator to interact with target interactive LLMs and explore interactions between the user and the interactive LLM system via \textit{i$\times$MCTS} (\textit{M}onte \textit{C}arlo \textit{T}ree \textit{S}earch for \textit{i}nteraction). In this way, we collect a dataset containing pairs of higher and lower-quality experiences using \textit{i$\times$MCTS}, and align interactive LLMs for high-level user engagement by direct preference optimization (DPO) accordingly. Experiments conducted on two socially-driven dialogue scenarios (emotional support conversations and persuasion for good) demonstrate that our method effectively enhances user engagement in interactive LLMs.
- Abstract(参考訳): 対話を通じてユーザエンゲージメントを高めることは、社会主導の対話において重要な役割を担います。
従来の作業では、関連する知識を推論したり、対話行動の流れを計画するためのモデルが最適化されていたが、ユーザエンゲージメントと知識または対話行動の関係は微妙であり、社会的に駆動された対話におけるユーザエンゲージメントを保証していない。
この目的のために,対話型LLMは,対話の今後の発展のシグナルを活用することで,ユーザエンゲージメントを学習することができる。
具体的には、ユーザエンゲージメントをより直接的かつ関連性の高い指標として、対話後の対話意図に関連するユーザの反応を、対話的LLMの整合に対する報酬として採用する。
そこで本研究では,ターゲットとなる対話型LCMと対話するユーザシミュレータを開発し,ユーザと対話型LCMシステムとの対話を \textit{i$\times$MCTS} (\textit{M}onte \textit{C}arlo \textit{T}ree \textit{S}earch for \textit{i}nteraction) を介して探索する。
このようにして,高次ユーザエンゲージメントのための対話型LCMを直接選好最適化(DPO)により調整し,高次ユーザエンゲージメントのための高次ユーザエクスペリエンスと低次ユーザエクスペリエンスのペアを含むデータセットを収集する。
2つの社交的な対話シナリオ(感情的支援会話と適切な説得)で実施した実験は,対話型LDMにおけるユーザエンゲージメントを効果的に向上することを示した。
関連論文リスト
- Tailored Conversations beyond LLMs: A RL-Based Dialogue Manager [0.7499722271664147]
本稿では,大規模言語モデル(LLM)をRLベースの対話マネージャと統合して,特定の目的を持ったオープンエンド対話を実現するフレームワークを提案する。
階層的強化学習を用いて対話の構造化フェーズをモデル化し,メタラーニングを用いて多様なユーザプロファイル間の適応性を向上する。
論文 参考訳(メタデータ) (2025-06-24T14:15:26Z) - DialogXpert: Driving Intelligent and Emotion-Aware Conversations through Online Value-Based Reinforcement Learning with LLM Priors [19.83349341267686]
大言語モデル(LLM)エージェントは、反応対話において優れるが、プロアクティブでゴール駆動的な相互作用に苦しむ。
提案するダイアログXpertは,各ターンごとに,小型で高品質な候補アクションセットを提案する。
ユーザの感情を追跡することで、DialogXpertは、真の共感的なつながりを育みながら、タスクを前進させる決定をそれぞれ調整する。
論文 参考訳(メタデータ) (2025-05-23T12:12:40Z) - Enhancing User-Oriented Proactivity in Open-Domain Dialogues with Critic Guidance [35.15965694815852]
オープンドメイン対話システムは自然な会話を生み出すことを目的としている。
既存の大きな言語モデル(LLM)は、ユーザのチャットの好みを積極的に理解できない。
ユーザ指向のプロアクティブ性を高めるために,ユーザ指向プロアクティブ(UPC)を提案する。
論文 参考訳(メタデータ) (2025-05-18T09:59:22Z) - Data Augmentation Integrating Dialogue Flow and Style to Adapt Spoken Dialogue Systems to Low-Resource User Groups [1.7725414095035827]
本研究では,音声対話システム(SDS)が,対話行動の異なるユーザと対話する場合に直面する課題について考察する。
限られたリソースを持つユーザグループのSDS性能を向上させるための新しいデータ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-20T03:33:04Z) - User-LLM: Efficient LLM Contextualization with User Embeddings [23.226164112909643]
User-LLMは、ユーザ埋め込みを利用して、大きな言語モデルとユーザ履歴の相互作用を直接コンテキスト化する新しいフレームワークである。
提案手法では,ユーザタイムラインを直接埋め込みとして表現することで,最大78.1倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-21T08:03:27Z) - Zero-Shot Goal-Directed Dialogue via RL on Imagined Conversations [70.7884839812069]
大規模言語モデル(LLM)は、多くの自然言語タスクに対する強力で一般的な解決策として登場した。
しかしながら、言語生成の最も重要なアプリケーションの多くは対話的であり、エージェントは望ましい結果に達するために相手と話し合わなければならない。
本研究では,そのような目標指向対話に対して,RLでLLMを適応させる新しい手法について検討する。
論文 参考訳(メタデータ) (2023-11-09T18:45:16Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - Multi-User MultiWOZ: Task-Oriented Dialogues among Multiple Users [51.34484827552774]
マルチユーザMulti-User MultiWOZデータセットを2つのユーザと1つのエージェント間のタスク指向対話としてリリースする。
これらの対話は、タスク指向のシナリオにおける協調的な意思決定の興味深いダイナミクスを反映している。
本稿では,複数ユーザ間のタスク指向のチャットを簡潔なタスク指向のクエリとして書き換える,マルチユーザコンテキストクエリ書き換えの新しいタスクを提案する。
論文 参考訳(メタデータ) (2023-10-31T14:12:07Z) - User Satisfaction Estimation with Sequential Dialogue Act Modeling in
Goal-oriented Conversational Systems [65.88679683468143]
我々は,ユーザ満足度を予測するために,対話行動の逐次的ダイナミクスを取り入れた新しいフレームワーク,すなわちUSDAを提案する。
USDAは、ユーザの満足度を予測するために、コンテンツと行動機能の連続的な遷移を対話に取り入れている。
4つのベンチマーク目標指向対話データセットによる実験結果から,提案手法はUSEの既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-02-07T02:50:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。