論文の概要: SNAPE-PM: Building and Utilizing Dynamic Partner Models for Adaptive Explanation Generation
- arxiv url: http://arxiv.org/abs/2505.13053v1
- Date: Mon, 19 May 2025 12:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.593506
- Title: SNAPE-PM: Building and Utilizing Dynamic Partner Models for Adaptive Explanation Generation
- Title(参考訳): SNAPE-PM:適応的説明生成のための動的パートナーモデルの構築と活用
- Authors: Amelie S. Robrecht, Christoph R. Kowalski, Stefan Kopp,
- Abstract要約: ダイアログへの適応は、成功した説明には不可欠だが、ダイアログシステムには大きな課題がある。
非定常的な意思決定プロセスとして説明生成を扱うアプローチを採用し,説明者に対する信念やインタラクションコンテキストの変化に応じて最適な戦略が変化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adapting to the addressee is crucial for successful explanations, yet poses significant challenges for dialogsystems. We adopt the approach of treating explanation generation as a non-stationary decision process, where the optimal strategy varies according to changing beliefs about the explainee and the interaction context. In this paper we address the questions of (1) how to track the interaction context and the relevant listener features in a formally defined computational partner model, and (2) how to utilize this model in the dynamically adjusted, rational decision process that determines the currently best explanation strategy. We propose a Bayesian inference-based approach to continuously update the partner model based on user feedback, and a non-stationary Markov Decision Process to adjust decision-making based on the partner model values. We evaluate an implementation of this framework with five simulated interlocutors, demonstrating its effectiveness in adapting to different partners with constant and even changing feedback behavior. The results show high adaptivity with distinct explanation strategies emerging for different partners, highlighting the potential of our approach to improve explainable AI systems and dialogsystems in general.
- Abstract(参考訳): ダイアログへの適応は、成功した説明には不可欠だが、ダイアログシステムには大きな課題がある。
非定常的な意思決定プロセスとして説明生成を扱うアプローチを採用し,説明者に対する信念やインタラクションコンテキストの変化に応じて最適な戦略が変化する。
本稿では,(1)形式化された計算パートナーモデルにおけるインタラクションコンテキストと関連するリスナーの特徴の追跡方法,(2)現在最高の説明戦略を決定する動的に調整された合理的な意思決定プロセスにおいて,このモデルをいかに活用するか,という課題に対処する。
本稿では,ユーザのフィードバックに基づいてパートナーモデルを継続的に更新するためのベイズ推論に基づくアプローチと,パートナーモデル値に基づいて意思決定を調整するための非定常マルコフ決定プロセスを提案する。
我々は,5つの模擬インターロケータによるこのフレームワークの実装を評価し,一定かつフィードバックの振る舞いが変化する異なるパートナーに適応する上での有効性を実証した。
その結果、異なるパートナーに対して異なる説明戦略が出現し、説明可能なAIシステムやダイアログシステム全般を改善するためのアプローチの可能性を強調し、高い適応性を示した。
関連論文リスト
- Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1240295759264]
本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文 参考訳(メタデータ) (2024-08-14T11:29:47Z) - On Predictive planning and counterfactual learning in active inference [0.20482269513546453]
本稿では,「計画」と「経験から学ぶ」に基づくアクティブ推論における2つの意思決定手法について検討する。
これらの戦略間のデータ-複雑さのトレードオフをナビゲートする混合モデルを導入する。
提案手法を,エージェントの適応性を必要とするグリッドワールドシナリオで評価する。
論文 参考訳(メタデータ) (2024-03-19T04:02:31Z) - Adaptive Bayesian Learning with Action and State-Dependent Signal
Variance [0.0]
この原稿は、行動と状態依存的な信号分散を意思決定モデルに組み込むことにより、ベイズ学習の先進的な枠組みを提示する。
この枠組みは、様々な経済システムにおける複雑なデータフィードバックループと意思決定プロセスを理解する上で重要である。
論文 参考訳(メタデータ) (2023-11-20T17:59:30Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - On Variational Inference for User Modeling in Attribute-Driven
Collaborative Filtering [10.64460581091531]
本稿では,因果推論を用いて時間的文脈からユーザの属性親和性を学習する手法を提案する。
この目的を確率論的機械学習問題として定式化し、モデルパラメータを推定するために変分推論に基づく手法を適用する。
論文 参考訳(メタデータ) (2020-12-02T22:39:58Z) - Hybrid Supervised Reinforced Model for Dialogue Systems [2.1485350418225244]
このモデルは,対話管理に必要なタスク – 状態追跡と意思決定 – に対処する。
このモデルは、非リカレントベースラインよりも高い性能、学習速度、堅牢性を達成する。
論文 参考訳(メタデータ) (2020-11-04T12:03:12Z) - Learning an Effective Context-Response Matching Model with
Self-Supervised Tasks for Retrieval-based Dialogues [88.73739515457116]
我々は,次のセッション予測,発話復元,不整合検出,一貫性判定を含む4つの自己教師型タスクを導入する。
我々はPLMに基づく応答選択モデルとこれらの補助タスクをマルチタスク方式で共同で訓練する。
実験結果から,提案した補助的自己教師型タスクは,多ターン応答選択において大きな改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-09-14T08:44:46Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。