論文の概要: RPO-PDT: Demonstrating Role-Play-Based Knowledge Adaptation for Student Support Dialogue (Demonstration System)
- arxiv url: http://arxiv.org/abs/2606.09255v1
- Date: Mon, 08 Jun 2026 09:27:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.897067
- Title: RPO-PDT: Demonstrating Role-Play-Based Knowledge Adaptation for Student Support Dialogue (Demonstration System)
- Title(参考訳): RPO-PDT:学生支援対話におけるロールプレイに基づく知識適応の実証(実証システム)
- Authors: Filip Janik, Ewa Olton, Robert Smales, Harris Spratt, Shea Tait, Md Zia Ullah, Yanchao Yu,
- Abstract要約: RPO-PDTは、高等教育における適応的な学生支援のための、検索地上のロールプレイベースの対話システムである。
RPO-PDTはテキストベースとFurhatベースのインボディードインタラクションの両方をサポートし、基礎的、安全、適応的な学生支援対話を示す。
- 参考スコア(独自算出の注目度): 1.2899392854599372
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present RPO-PDT: a retrieval-grounded, role-play-based dialogue system for adaptive student support in higher education. RPO-PDT is: (1) able to provide institution-specific Personal Development Tutor (PDT) guidance using structured knowledge sources; (2) constrained by explicit persona, boundary, confidentiality, and safety policies; and (3) designed around a reverse-roleplay loop where unresolved interactions are replayed from the student perspective, enabling alternative tutor strategies to be generated and stored as reusable strategy memory. RPO-PDT supports both text-based and Furhat-based embodied interaction for demonstrating grounded, safe, and adaptive student-support dialogue.
- Abstract(参考訳): 高等教育における適応型学生支援のための検索型ロールプレイ型対話システム RPO-PDT を提案する。
RPO-PDTは,(1)構造化知識ソースを用いた制度固有の個人開発チューター(PDT)ガイダンスの提供,(2)明示的なペルソナ,境界,機密性,安全ポリシによる制約,(3)未解決のインタラクションを学生の視点で再生するリバースロールループを中心に設計され,代替のチューター戦略が再利用可能な戦略記憶として生成され,保存される。
RPO-PDTはテキストベースとFurhatベースのインボディードインタラクションの両方をサポートし、基礎的、安全、適応的な学生支援対話を示す。
関連論文リスト
- Tell Me Why: Designing an Explainable LLM-based Dialogue System for Student Problem Behavior Diagnosis [18.727061359162786]
細調整された大言語モデル(LLM)に基づく説明可能な対話システムを提案する。
このシステムは、説明可能なAI(xAI)に基づく階層的帰属法を用いて、レコメンデーション毎に対話的証拠を特定し、自然言語による説明を生成する。
プレサービス教員22名を対象に予備調査を行ったところ,説明を受けた参加者はシステムに対する信頼感が高かった。
論文 参考訳(メタデータ) (2026-04-24T05:23:25Z) - Personalizing Student-Agent Interactions Using Log-Contextualized Retrieval Augmented Generation (RAG) [3.5262811753348715]
大規模言語モデル(LLM)は動的教育的相互作用を促進するが、信頼性、信頼、教育的価値を損なう。
Retrieval-augmented Generation (RAG)は、LLMの出力をキュレートした知識に基礎を置いているが、ユーザ入力と知識ベースとの明確なセマンティックリンクが必要である。
環境ログを用いて協調会話を文脈化することでRAG検索を強化した対数文脈化RAG(LC-RAG)を提案する。
論文 参考訳(メタデータ) (2025-05-22T19:31:40Z) - Simulating Before Planning: Constructing Intrinsic User World Model for User-Tailored Dialogue Policy Planning [31.785493263807684]
本稿では,ユーザ特性とフィードバックをモデル化する内在的ユーザワールドモデルを組み込んだUDP(User-Tailored Dialogue Policy Planning)フレームワークを提案する。
UDP は,(1) ユーザプロファイルを動的に推測するために拡散モデルを用いたユーザペルソナポートレイティング,(2) ユーザフィードバック予測, ブラウン橋にインスパイアされた予測器を用いたユーザ反応予測,(3) ユーザ対応型ポリシープランニング, これらの洞察の統合による応答戦略の最適化の3段階で動作する。
論文 参考訳(メタデータ) (2025-04-18T11:48:55Z) - Planning Like Human: A Dual-process Framework for Dialogue Planning [31.995557540062553]
大規模言語モデル(LLM)における対話計画を強化するための2段階対話計画フレームワークを提案する。
心理学における二重過程理論に触発されて、直感的(高速)と分析的(スロー)の2つの思考様式を具現化した枠組みを提案する。
実験により,DPDPが高品質な対話と操作効率を両立し,既存手法よりも優れていることを確認した。
論文 参考訳(メタデータ) (2024-06-08T06:52:47Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - Towards Unified Conversational Recommender Systems via
Knowledge-Enhanced Prompt Learning [89.64215566478931]
会話レコメンデータシステム(CRS)は,ユーザの嗜好を積極的に取り入れ,自然言語会話を通じて高品質な項目を推薦することを目的としている。
効果的なCRSを開発するためには、2つのモジュールをシームレスに統合することが不可欠である。
知識強調学習に基づく統一CRSモデルUniCRSを提案する。
論文 参考訳(メタデータ) (2022-06-19T09:21:27Z) - Structural Pre-training for Dialogue Comprehension [51.215629336320305]
本稿では,SPIDER, Structure Pre-trained DialoguE Readerについて述べる。
対話のような特徴をシミュレートするために,元のLM目的に加えて,2つの訓練目標を提案する。
広く使われている対話ベンチマークの実験結果から,新たに導入した自己教師型タスクの有効性が検証された。
論文 参考訳(メタデータ) (2021-05-23T15:16:54Z) - Guided Dialog Policy Learning without Adversarial Learning in the Loop [103.20723982440788]
対話政策とともに報酬関数を学習するために,多くの逆学習法が提案されている。
敵の訓練を2つの段階に分割することを提案する。
まず,識別器を補助対話生成器で訓練し,得られた報酬モデルを共通RL法に組み込んで対話ポリシー学習を指導する。
論文 参考訳(メタデータ) (2020-04-07T11:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。