論文の概要: SNAP: A Plan-Driven Framework for Controllable Interactive Narrative Generation
- arxiv url: http://arxiv.org/abs/2601.11529v1
- Date: Tue, 18 Nov 2025 03:03:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.736312
- Title: SNAP: A Plan-Driven Framework for Controllable Interactive Narrative Generation
- Title(参考訳): SNAP: 制御可能な対話型ナラティブ生成のための計画駆動フレームワーク
- Authors: Geonwoo Bang, DongMyung Kim, Hayoung Oh,
- Abstract要約: 提案するSNAP(Story and Narrative-based Agent with Planning)は,Web環境における物語の漂流を防止するために,明示的なプランを持つセルに構築するフレームワークである。
SNAPは、多様なユーザ応答に対応しながら、一貫性のあるシナリオ一貫性の対話を可能にする。
- 参考スコア(独自算出の注目度): 0.23814052021083346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) hold great potential for web-based interactive applications, including browser games, online education, and digital storytelling platforms. However, LLM-based conversational agents suffer from spatiotemporal distortions when responding to variant user inputs, failing to maintain consistency with provided scenarios. We propose SNAP (Story and Narrative-based Agent with Planning), a framework that structures narratives into Cells with explicit Plans to prevent narrative drift in web environments. By confining context within each Cell and employing detailed plans that specify spatiotemporal settings, character actions, and plot developments, SNAP enables coherent and scenario-consistent dialogues while adapting to diverse user responses. Via automated and human evaluations, we validate SNAP's superiority in narrative controllability, demonstrating effective scenario consistency despite variant user inputs in web-based interactive storytelling.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ブラウザゲーム、オンライン教育、デジタルストーリーテリングプラットフォームなど、Webベースのインタラクティブアプリケーションに大きな可能性を秘めている。
しかし、LLMベースの会話エージェントは、異なるユーザ入力に応答するときに時空間歪みに悩まされ、提供されるシナリオとの整合性の維持に失敗する。
提案するSNAP(Story and Narrative-based Agent with Planning)は,Web環境における物語の漂流を防止するために,明示的なプランで物語をセルに構築するフレームワークである。
各セル内のコンテキストを整理し、時空間設定、キャラクタアクション、プロット開発を規定する詳細なプランを採用することで、SNAPは多様なユーザ応答に適応しつつ、一貫性とシナリオ整合性の対話を可能にする。
自動的, 人的評価により, 対話型ストーリーテリングにおけるユーザ入力の変化にもかかわらず, SNAPの物語制御性に対する優位性を検証し, 効果的なシナリオ整合性を示す。
関連論文リスト
- ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents [52.7201882529976]
対話エージェントの制御性を高めるため,SOP誘導モンテカルロ木探索(MCTS)計画フレームワークを提案する。
これを実現するために、GPT-4oを用いた半自動ロールプレイシステムを用いて、SOPアノテーション付きマルチシナリオ対話からなるデータセットをキュレートする。
また、SOP予測のための教師付き微調整と思考の連鎖推論を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T12:23:02Z) - Dialogue Action Tokens: Steering Language Models in Goal-Directed Dialogue with a Multi-Turn Planner [51.77263363285369]
本稿では,対話行動トークンと呼ばれる言語モデルエージェントを用いて,目標指向の対話を計画する手法を提案する。
中心となる考え方は、各発話をアクションとして扱うことで、強化学習のような既存のアプローチを適用することができるゲームに対話を変換することである。
論文 参考訳(メタデータ) (2024-06-17T18:01:32Z) - Plug-and-Play Policy Planner for Large Language Model Powered Dialogue
Agents [121.46051697742608]
そこで本稿では,PDPPという言語モデルプラグインを用いて対話問題を整理するための新たな対話ポリシー計画パラダイムを提案する。
具体的には、利用可能な人間の注釈付きデータに対する教師付き微調整を容易にするための新しいトレーニングフレームワークを開発する。
PPDPPは3つの異なるプロアクティブな対話アプリケーションにおいて、既存のアプローチを一貫して、実質的に上回っている。
論文 参考訳(メタデータ) (2023-11-01T03:20:16Z) - DiactTOD: Learning Generalizable Latent Dialogue Acts for Controllable
Task-Oriented Dialogue Systems [15.087619144902776]
本稿では,潜在空間における対話行動を表現する対話行動モデル(DiactTOD)を提案する。
大規模なコーパスで事前トレーニングを行うと、DiactTODは対話を予測し制御し、制御可能な応答を生成する。
論文 参考訳(メタデータ) (2023-08-01T23:29:16Z) - Structured Attention for Unsupervised Dialogue Structure Induction [110.12561786644122]
本稿では、構造化された注意層を離散潜在状態を持つ変化型リカレントニューラルネットワーク(VRNN)モデルに組み込んで、教師なしの方法で対話構造を学ぶことを提案する。
バニラVRNNと比較して、構造化された注意は、構造的帰納バイアスを強制しながら、ソース文の埋め込みの異なる部分にフォーカスすることができる。
論文 参考訳(メタデータ) (2020-09-17T23:07:03Z) - Meta Dialogue Policy Learning [58.045067703675095]
我々は、ドメイン間の共有可能な低レベル信号を利用するために、Deep Transferable Q-Network (DTQN)を提案する。
状態と行動表現空間をこれらの低レベル成分に対応する特徴部分空間に分解する。
実験において,本モデルは,成功率と対話効率の両方の観点から,ベースラインモデルより優れている。
論文 参考訳(メタデータ) (2020-06-03T23:53:06Z) - Policy-Driven Neural Response Generation for Knowledge-Grounded Dialogue
Systems [18.375851346138155]
Seq2seqのニューラルレスポンス生成アプローチは、生成されたレスポンスの内容やスタイルを制御するための明確なメカニズムを持っていない。
本稿では、対話ポリシーを用いて、アクションプランの形式でターゲット応答の内容とスタイルを計画する。
文レベルで動作させる基本対話ポリシーは,ターンレベル生成よりも応答性がよいことを示す。
論文 参考訳(メタデータ) (2020-05-26T06:09:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。