論文の概要: Adaptive Interviewing for Persona Simulation in LLMs: Evidence-Grounded Reasoning Improves Decision Alignment
- arxiv url: http://arxiv.org/abs/2605.29458v1
- Date: Thu, 28 May 2026 06:53:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.869461
- Title: Adaptive Interviewing for Persona Simulation in LLMs: Evidence-Grounded Reasoning Improves Decision Alignment
- Title(参考訳): LLMにおけるペルソナシミュレーションのための適応的面接:決定アライメントを改善する証拠付き推論
- Authors: Ruoxi Su, Yuhan Liu, Jingyu Hu,
- Abstract要約: 構造化された3段階対話を通してペルソナ関連情報を収集するアダプティブ・インタビュー・フレームワークを提案する。
我々は,大規模言語モデルが道徳ジレンマシナリオにおける参加者の決定をシミュレートできるかどうかを評価する。
- 参考スコア(独自算出の注目度): 23.066564025282386
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately simulating the decisions of a specific individual remains challenging for large language models (LLMs), partly because persona information is often provided as static descriptions that miss the values, experiences, and contextual cues needed for individual-level decision simulation. We propose an adaptive interview framework that gathers persona-relevant information through a structured three-stage dialogue: core questions, dynamic follow-ups, and a synthesized personality summary. Using the resulting interview transcripts, we evaluate whether LLMs can simulate participants' decisions in moral dilemma scenarios. We compare three conversational contexts -- Core-10 responses, the full interview dialogue, and a summarized persona representation. We find that adaptive interviewing functions less as a uniform accuracy booster and more as a selective grounding mechanism: follow-up-derived evidence is incorporated in around 40% of full-interview traces, and these follow-up-grounded predictions are more accurate than core-only grounded ones (45.5% vs. 39.3%). These findings highlight that richer persona context alone is insufficient: improvements arise only when models actually ground their decisions in user-specific evidence.
- Abstract(参考訳): 特定の個人の決定を正確にシミュレートすることは、大きな言語モデル(LLM)では困難であり、その理由は、ペルソナ情報は、個々のレベルの決定シミュレーションに必要な値、経験、文脈を見逃す静的な記述としてしばしば提供されるためである。
本稿では,基本質問,動的フォローアップ,合成人格要約という,構造化された3段階対話を通してペルソナ関連情報を収集するアダプティブ・インタビュー・フレームワークを提案する。
その結果,LLMがモラルジレンマのシナリオで参加者の判断をシミュレートできるかどうかを評価する。
Core-10レスポンス,フルインタビュー対話,要約されたペルソナ表現という,3つの会話コンテキストを比較した。
順応的面接機能は、一様精度向上剤としてより少なく、選択的接地機構としてより少ないことが判明した: フォローアップ由来の証拠は、フルインタービュートレースの約40%に組み込まれ、これらのフォローアップ基底予測は、コアのみ接地されたもの(45.5% vs. 39.3%)よりも正確である。
これらの知見は、リッチなペルソナコンテキストだけでは不十分であることを示している。
関連論文リスト
- AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence [1.7294100412670375]
感情知性(EI)は人間のコミュニケーションの中心であり、評価することがますます重要になっている。
AttuneBenchは200個の真のマルチターンヒューマンモデル会話をベースとしたベンチマークである。
感情認識,行動分類,嗜好予測,判断された応答品質のモデルランキングは,ほぼ独立していることがわかった。
論文 参考訳(メタデータ) (2026-05-20T21:06:05Z) - When Consistency Becomes Bias: Interviewer Effects in Semi-Structured Clinical Interviews [40.15765126212381]
我々は3つのデータセット、ANDROIDS、DAIC-WOZ、E-DAICを分析した。
半構造化インタビューにおけるインタビュアープロンプトからの体系的バイアスを同定する。
本研究は, クロスデータセット, アーキテクチャ非依存のバイアスに着目し, 時間と話者による決定証拠のローカライズを行う分析の必要性を強調した。
論文 参考訳(メタデータ) (2026-03-25T17:55:00Z) - Towards Realistic Personalization: Evaluating Long-Horizon Preference Following in Personalized User-LLM Interactions [50.70965714314064]
大規模言語モデル(LLM)は、ユーザが拡張されたインタラクションよりも複雑で多様な好みを共有するパーソナルアシスタントとして、ますます機能している。
この研究は、パーソナライズされたユーザ-LLMインタラクションにおいて、リアルな嗜好フォローを評価するためのベンチマークであるRealPrefを提案する。
論文 参考訳(メタデータ) (2026-03-04T15:42:43Z) - InterviewSim: A Scalable Framework for Interview-Grounded Personality Simulation [32.09483697866529]
大きな言語モデルで実際の個人性をシミュレートするには、真正の個人データにおいて基礎となる生成が必要である。
大規模にパーソナリティシミュレーションを行うためのインタビューグラウンド評価フレームワークを提案する。
我々は,1000人以上の公的な個人を対象とした23,000件の面接書から671,000件以上の質問回答対を抽出した。
論文 参考訳(メタデータ) (2026-02-23T19:21:10Z) - Emulating Aggregate Human Choice Behavior and Biases with GPT Conversational Agents [0.48439699124726004]
大規模言語モデル(LLM)は、よく知られたバイアスを再現することが示されている。
我々は,3つの確立された意思決定シナリオを会話環境に適応させ,人間の実験を行った。
人間の行動をどのように整合させるかという点において,モデル間に顕著な違いが認められた。
論文 参考訳(メタデータ) (2026-02-05T12:33:05Z) - TwinVoice: A Multi-dimensional Benchmark Towards Digital Twins via LLM Persona Simulation [55.55404595177229]
大型言語モデル(LLM)は、人間のような能力を示す。
TwinVoiceは、さまざまな現実世界のコンテキストにわたるペルソナシミュレーションを評価するためのベンチマークである。
論文 参考訳(メタデータ) (2025-10-29T14:00:42Z) - Pathways of Thoughts: Multi-Directional Thinking for Long-form Personalized Question Answering [57.12316804290369]
ユーザ固有の情報ニーズに質問応答システムを適用するためには,パーソナライゼーションが不可欠である。
本稿では,タスク固有の微調整を必要とせず,任意の大規模言語モデル (LLM) に適用可能な推論段階の方法として,思考の経路 (PoT) を提案する。
PoTは競争ベースラインを一貫して上回り、13.1%の相対的な改善を達成している。
論文 参考訳(メタデータ) (2025-09-23T14:44:46Z) - From Guessing to Asking: An Approach to Resolving the Persona Knowledge Gap in LLMs during Multi-Turn Conversations [11.958380211411386]
本研究では,ペルソナの知識ギャップ,モデルの内的理解と一貫性とパーソナライズされた会話に必要な知識との相違について紹介する。
本稿では,ペルソナの知識ギャップを動的に検出・解決する新しいフレームワークであるCPER(Conversation Preference Elicitation and Recommendation)を提案する。
CPERは、嗜好抽出のためのコンテキスト理解モジュール、不確実性を計測し、ペルソナアライメントを精製する動的フィードバックモジュール、蓄積されたユーザコンテキストに基づいて応答を適応するペルソナ駆動応答生成モジュールの3つの主要なモジュールで構成されている。
論文 参考訳(メタデータ) (2025-03-16T15:55:29Z) - Partner Matters! An Empirical Study on Fusing Personas for Personalized
Response Selection in Retrieval-Based Chatbots [51.091235903442715]
本稿では,自己とパートナーの話者が応答選択の課題に与える影響について検討する。
4つのペルソナ融合戦略が設計されており、異なる方法でペルソナがコンテキストや応答と相互作用することを前提としている。
Persona-Chatデータセットに関する実証研究は、パートナーペルソナが応答選択の精度を向上させることができることを示している。
論文 参考訳(メタデータ) (2021-05-19T10:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。