論文の概要: A Reflective Storytelling Agent for Older Adults: Integrating Argumentation Schemes and Argument Mining in LLM-Based Personalised Narratives
- arxiv url: http://arxiv.org/abs/2605.10531v1
- Date: Mon, 11 May 2026 13:17:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.839218
- Title: A Reflective Storytelling Agent for Older Adults: Integrating Argumentation Schemes and Argument Mining in LLM-Based Personalised Narratives
- Title(参考訳): 高齢者向けリフレクティブ・ストーリーテリング・エージェント : LLMによるパーソナライズド・ナラティブにおける論証と論証マイニングの統合
- Authors: Jayalakshmi Baskar, Vera C. Kaelin, Kaan Kilic, Helena Lindgren,
- Abstract要約: 本研究は,知識駆動型大規模言語モデル(LLM)に基づくストーリーテリングが,高齢者向けデジタル・コンパニオンとの客観的な対話を支援するかどうかを考察する。
本稿では,ナレッジグラフ,ユーザモデリング,議論理論,議論マイニングを統合し,物語生成のガイドとインスペクションを行う反射型ストーリーテリングエージェントを提案する。
- 参考スコア(独自算出の注目度): 0.48531536122413316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work investigates whether knowledge-driven large language model (LLM)-based storytelling can support purposeful narrative interaction with a digital companion for older adults. To address known limitations of LLMs, including hallucinations and limited transparency, we present a reflective storytelling agent integrating knowledge graphs, user modelling, argumentation theory, and argument mining to guide and inspect narrative generation. The study consisted of two phases. Phase I employed participatory design involving 11 domain experts in a formative evaluation that informed iterative refinement. The resulting system generates narratives grounded in structured user models representing health-promoting activities and motivations. Phase II involved 55 older adults evaluating persona-based narratives across four prompts and two creativity levels. Participants assessed perceived purpose, usefulness, cultural relatability, and inconsistencies. The system additionally computed hallucination-risk indicators to evaluate generated narratives. Participants recognised personally relevant purposes in roughly two thirds of narratives, while argument-based purposes were identified in around half of these cases. Cultural recognisability strongly influenced willingness to use the functionality, whereas minor inconsistencies were often tolerated when narratives remained understandable and personally relevant. Narratives with higher hallucination-risk indicators were more often perceived as inconsistent, while higher argument-quality indicators tended to co-occur with higher clarity and meaningfulness ratings. Overall, the study positions argument mining as a reflective inspection mechanism for comparing formal grounding signals with human evaluations in health-oriented LLM storytelling for older adults.
- Abstract(参考訳): 本研究は,知識駆動型大規模言語モデル(LLM)に基づくストーリーテリングが,高齢者向けデジタル・コンパニオンとの客観的な対話を支援するかどうかを考察する。
幻覚や透明性の制限など,LLMの既知の限界に対処するため,知識グラフ,ユーザモデリング,議論理論,議論マイニングを統合し,物語生成の指導と検査を行う反射型ストーリーテリングエージェントを提案する。
研究は2つの段階で構成された。
第1相は、反復的洗練を知らせる形式的評価において、11のドメインエキスパートを含む参加型設計を採用した。
得られたシステムは、健康増進活動とモチベーションを表す構造化されたユーザモデルに基づく物語を生成する。
第2段階では、55人の高齢者が4つのプロンプトと2つの創造性レベルにまたがってペルソナに基づく物語を評価した。
参加者は、認識された目的、有用性、文化的相対性、矛盾を評価した。
このシステムは、生成した物語を評価するために幻覚リスク指標も計算した。
参加者は、物語の約3分の2で個人的な目的を認め、議論に基づく目的は、約半数で特定された。
文化的な認識力は機能の使用意欲に強く影響したが、物語が理解可能で個人的な関係を保ちながら、小さな矛盾がしばしば許容された。
高い幻覚リスク指標を持つ物語は矛盾すると見なされることが多いが、高い議論品質指標はより明瞭で有意義な評価と共起する傾向にあった。
本研究は,健常成人向けLLMストーリーテリングにおいて,ホルムグラウンドング信号と人間による評価とを比較するための反射検査機構として議論の採鉱を位置づけた。
関連論文リスト
- Re:Verse -- Can Your VLM Read a Manga? [14.057881684215047]
現在の視覚言語モデル(VLM)は、表面レベルの認識と深い物語的推論の間に重要なギャップを示す。
本稿では,細粒度マルチモーダルアノテーション,クロスモーダル埋め込み解析,検索強化評価を組み合わせた新しい評価フレームワークを提案する。
本稿では,VLMにおける長期的物語理解に関する最初の体系的研究を,生成的ストーリーテリング,文脈的対話グラウンドニング,時間的推論という3つのコア評価軸を通じて行った。
論文 参考訳(メタデータ) (2025-08-11T22:40:05Z) - How LLMs Comprehend Temporal Meaning in Narratives: A Case Study in Cognitive Evaluation of LLMs [13.822169295436177]
本研究では,人文研究に用いられた物語において,大規模言語モデル(LLM)が言語的側面の時間的意味をどう扱うかを検討する。
以上の結果から,LLMは原型性に過度に依存し,相反する側面判断を生じ,側面から派生した因果推論に苦慮することが明らかとなった。
これらの結果は,LLMのプロセスの側面が人間と根本的に異なり,ロバストな物語理解が欠如していることを示唆している。
論文 参考訳(メタデータ) (2025-07-18T18:28:35Z) - EvolvTrip: Enhancing Literary Character Understanding with Temporal Theory-of-Mind Graphs [23.86303464364475]
EvolvTripは、物語を通して心理学的発達を追跡する視点対応の時間知識グラフである。
本研究は,物語理解における時間的性格的状態の明示的表現の重要性を強調した。
論文 参考訳(メタデータ) (2025-06-16T16:05:17Z) - Are Large Language Models Capable of Generating Human-Level Narratives? [114.34140090869175]
本稿ではストーリーテリングにおけるLLMの能力について考察し,物語の展開とプロットの進行に着目した。
本稿では,3つの談話レベルの側面から物語を分析するための新しい計算フレームワークを提案する。
談話機能の明示的な統合は、ニューラルストーリーテリングの40%以上の改善によって示されるように、ストーリーテリングを促進することができることを示す。
論文 参考訳(メタデータ) (2024-07-18T08:02:49Z) - Analyzing LLM Behavior in Dialogue Summarization: Unveiling Circumstantial Hallucination Trends [38.86240794422485]
対話要約のための大規模言語モデルの忠実度を評価する。
私たちの評価は幻覚を構成するものに関して微妙な点を呈する。
既存の指標より優れた微細な誤差検出のための2つのプロンプトベースのアプローチを導入する。
論文 参考訳(メタデータ) (2024-06-05T17:49:47Z) - VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.43276586087863]
LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。
既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。
対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文 参考訳(メタデータ) (2024-04-22T04:49:22Z) - M-SENSE: Modeling Narrative Structure in Short Personal Narratives Using
Protagonist's Mental Representations [14.64546899992196]
本研究では,登場人物の心的状態の推測を解析し,物語構造の顕著な要素を自動的に検出するタスクを提案する。
本稿では,物語構造の主要な要素,特にクライマックスと解像度のマニュアルアノテーションを含む,短い個人物語のSTORIESデータセットを紹介する。
我々のモデルは、クライマックスと解像度を識別するタスクにおいて、大幅な改善を達成できる。
論文 参考訳(メタデータ) (2023-02-18T20:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。