論文の概要: SPASM: Stable Persona-driven Agent Simulation for Multi-turn Dialogue Generation
- arxiv url: http://arxiv.org/abs/2604.09212v1
- Date: Fri, 10 Apr 2026 11:05:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.831
- Title: SPASM: Stable Persona-driven Agent Simulation for Multi-turn Dialogue Generation
- Title(参考訳): SPASM:マルチターン対話生成のための安定なペルソナ駆動エージェントシミュレーション
- Authors: Han Luo, Guy Laban,
- Abstract要約: 大規模言語モデルは、チューター、サポート、カウンセリングなどのマルチターン設定に徐々にデプロイされている。
LLM会話は、ペルソナドリフト、ロール混乱、"エチョーイング"のようなアイデンティティ関連の失敗を蓄積することができる
SPASMは,シミュレーションを (i) ペルソナ生成に分割し,スキーマサンプリング,妥当性検証,自然言語ペルソナ作成を行う。
- 参考スコア(独自算出の注目度): 4.663948718816864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models are increasingly deployed in multi-turn settings such as tutoring, support, and counseling, where reliability depends on preserving consistent roles, personas, and goals across long horizons. This requirement becomes critical when LLMs are used to generate synthetic dialogues for training and evaluation, since LLM--LLM conversations can accumulate identity-related failures such as persona drift, role confusion, and "echoing", where one agent gradually mirrors its partner. We introduce SPASM (Stable Persona-driven Agent Simulation for Multi-turn dialogue generation), a modular, stability-first framework that decomposes simulation into (i) persona creation via schema sampling, plausibility validation, and natural-language persona crafting, (ii) Client--Responder dialogue generation, and (iii) termination detection for coherent stopping. To improve long-horizon stability without changing model weights, we propose Egocentric Context Projection (ECP): dialogue history is stored in a perspective-agnostic representation and deterministically projected into each agent's egocentric view before generation. Across three LLM backbones (GPT-4o-mini, DeepSeek-V3.2, Qwen-Plus) and nine Client--Responder pairings, we construct a dataset of 4,500 personas and 45,000 conversations (500 personas X 10 conversations per pairing). Ablations show ECP substantially reduces persona drift and, under human validation, eliminates echoing; embedding analyses recover persona structure and reveal strong responder-driven interaction geometry. Our code is available at https://github.com/lhannnn/SPASM.
- Abstract(参考訳): 大規模な言語モデルは、チューター、サポート、カウンセリングなどのマルチターン設定にますますデプロイされ、信頼性は、一貫した役割、ペルソナ、長期にわたる目標の保存に依存する。
LLM-LLM会話はペルソナの漂流、役割の混乱、そして、あるエージェントがそのパートナーを徐々に反映する「エチョーイング」といったアイデンティティ関連障害を蓄積できるため、LLMがトレーニングと評価のために合成対話を生成する場合、この要件は重要となる。
SPASM(Stable Persona-driven Agent Simulation for Multi-turnダイアログ生成のための安定型エージェントシミュレーション)を導入する。
(i)スキーマサンプリングによるペルソナ作成、妥当性検証、自然言語ペルソナ作成
(二)クライアント--応答者対話生成、及び
三 コヒーレント停止の終了検出
モデル重みを変化させることなく長期安定性を向上させるために,対話履歴を視点に依存しない表現に格納し,生成前に各エージェントの自我中心の視点に決定的に投影するEgocentric Context Projection (ECP)を提案する。
3つのLCMバックボーン(GPT-4o-mini,DeepSeek-V3.2,Qwen-Plus)と9つのクライアント-レスポンダペアリングにまたがって,4,500人のペルソナと45,000人の会話(ペアリング毎に500人のペルソナX10の会話)のデータセットを構築した。
アブレーションにより、ECPはペルソナの漂流を著しく減少させ、ヒトの検証ではエコーを排除し、ペルソナの復元構造を埋め込み解析し、強い応答者主導の相互作用の幾何を明らかにする。
私たちのコードはhttps://github.com/lhannnn/SPASM.comで公開されています。
関連論文リスト
- Consistently Simulating Human Personas with Multi-Turn Reinforcement Learning [52.07170679746533]
大規模言語モデル(LLM)は、セラピー、教育、社会的役割プレイといったインタラクティブな環境において、人間のユーザをシミュレートするためにますます使われています。
LLM生成対話におけるペルソナの一貫性の評価と改善のための統一的なフレームワークを提案する。
我々は3つの自動メトリクス、即行一貫性、行間一貫性、Q&A一貫性を定義し、異なるタイプのペルソナドリフトをキャプチャし、それぞれが人間のアノテーションに対して検証する。
論文 参考訳(メタデータ) (2025-10-31T19:40:41Z) - TwinVoice: A Multi-dimensional Benchmark Towards Digital Twins via LLM Persona Simulation [55.55404595177229]
大型言語モデル(LLM)は、人間のような能力を示す。
TwinVoiceは、さまざまな現実世界のコンテキストにわたるペルソナシミュレーションを評価するためのベンチマークである。
論文 参考訳(メタデータ) (2025-10-29T14:00:42Z) - A Framework for Generating Conversational Recommendation Datasets from Behavioral Interactions [2.0693204407592836]
ConvRecStudioは、リアルタイムなマルチターンダイアログをシミュレートするフレームワークで、タイムスタンプによるユーザとイテムのインタラクションとレビューに基礎を置いている。
我々は、MobileRec、Yelp、Amazon Electronicsの3つのドメインにConvRecStudioを適用する。
論文 参考訳(メタデータ) (2025-06-14T22:58:48Z) - A Personalized Conversational Benchmark: Towards Simulating Personalized Conversations [112.81207927088117]
PersonaConvBenchは、大規模言語モデル(LLM)とのマルチターン会話におけるパーソナライズされた推論と生成を評価するためのベンチマークである。
我々は,複数の商用およびオープンソース LLM を統一的なプロンプト設定でベンチマークし,パーソナライズされた履歴を組み込むことで大幅な性能向上が得られることを観察した。
論文 参考訳(メタデータ) (2025-05-20T09:13:22Z) - Exploring the Potential of Large Language Models to Simulate Personality [39.58317527488534]
我々は,大言語モデル(LLM)を用いて,ビッグファイブモデルに従って個人特性をシミュレートすることを目指している。
本稿では,事前に定義された5つの特徴を持つ生成テキストのデータセットを提示し,パーソナリティスキルのシミュレーションに基づいてLLMをテストするための分析フレームワークを提供する。
論文 参考訳(メタデータ) (2025-02-12T10:17:18Z) - X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すかどうかを調べる。
従来の設定では、各参加者は一度に1つのメッセージに制限される。
本稿では,textitburstダイアログパターンを用いて,元のテストを強化するtextbftextscX-Turingを提案する。
論文 参考訳(メタデータ) (2024-08-19T09:57:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。