論文の概要: Understanding Mental States to Guide Social Influence in Multi-Person Group Dialogue
- arxiv url: http://arxiv.org/abs/2601.13687v1
- Date: Tue, 20 Jan 2026 07:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.206459
- Title: Understanding Mental States to Guide Social Influence in Multi-Person Group Dialogue
- Title(参考訳): 多人数グループ対話における社会的影響を導く精神状態の理解
- Authors: Zhichao Liang, Satoshi Nakamura,
- Abstract要約: SocialMindChangeは、心の追跡から、社会的相互作用における心の変化へと移行するベンチマークである。
我々は1200の社会的コンテキストを構築し、6000のシナリオと90,000以上の質問をカバーし、それぞれが現実主義と品質を検証した。
- 参考スコア(独自算出の注目度): 4.986094627059729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing dynamic Theory of Mind (ToM) benchmarks mostly place language models in a passive role: the model reads a sequence of connected scenarios and reports what people believe, feel, intend, and do as these states change. In real social interaction, ToM is also used for action: a speaker plans what to say in order to shift another person's mental-state trajectory toward a goal. We introduce SocialMindChange, a benchmark that moves from tracking minds to changing minds in social interaction. Each instance defines a social context with 4 characters and five connected scenes. The model plays one character and generates dialogue across the five scenes to reach the target while remaining consistent with the evolving states of all participants. SocialMindChange also includes selected higher-order states. Using a structured four-step framework, we construct 1,200 social contexts, covering 6000 scenarios and over 90,000 questions, each validated for realism and quality. Evaluations on ten state-of-the-art LLMs show that their average performance is 54.2% below human performance. This gap suggests that current LLMs still struggle to maintain and change mental-state representations across long, linked interactions.
- Abstract(参考訳): 既存の動的マインド理論(ToM)ベンチマークは、主に言語モデルを受動的役割に配置する: モデルは接続されたシナリオのシーケンスを読み、これらの状態が変化するにつれて人々が何を信じ、感じ、意図し、何をするかを報告します。
実際の社会的相互作用では、ToMは行動にも使用される: 話者は、相手の精神状態の軌跡を目標に向けてシフトするために何を言うべきかを計画する。
このベンチマークは、心の追跡から、社会的相互作用における心の変化へと移行するものだ。
各インスタンスは4文字と5つの接続されたシーンで社会的コンテキストを定義する。
モデルは1つのキャラクタを再生し、5つのシーン間で対話を生成し、ターゲットに到達すると同時に、すべての参加者の進化状態と整合性を保つ。
SocialMindChangeには、選択された高次の状態も含まれている。
構造化された4段階のフレームワークを用いて、1200の社会的コンテキストを構築し、6000のシナリオと90,000以上の質問をカバーし、それぞれが現実性と品質を検証した。
最先端の10のLCMの評価によると、平均的な性能は人間よりも54.2%低い。
このギャップは、現在のLLMが長く結びついた相互作用を通して精神状態の表現を維持し、変化させることに苦慮していることを示唆している。
関連論文リスト
- Beyond Survival: Evaluating LLMs in Social Deduction Games with Human-Aligned Strategies [54.08697738311866]
Werewolfのようなソーシャル推論ゲームは、言語、推論、戦略を組み合わせている。
我々は,100時間以上のビデオ,32.4M発声トークン,15の規則変種を含む高品質で人間認証されたWerewolfデータセットをキュレートした。
本稿では,勝利派戦略を2段階の真理として活用する新たな戦略調整評価法を提案する。
論文 参考訳(メタデータ) (2025-10-13T13:33:30Z) - SocialEval: Evaluating Social Intelligence of Large Language Models [70.90981021629021]
ソーシャルインテリジェンス(英語版) (SI) は、社会的目標を達成するために社会的相互作用をナビゲートする際に賢明に行動する対人能力を持つ人間を装備する。
結果指向の目標達成評価とプロセス指向の対人能力評価という,運用評価パラダイムを提示する。
スクリプトベースのバイリンガルSIベンチマークであるSocialEvalを提案する。
論文 参考訳(メタデータ) (2025-06-01T08:36:51Z) - Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models [75.85319609088354]
SAGE(Sentient Agent as a Judge)は、大規模言語モデルの評価フレームワークである。
SAGEは人間のような感情の変化や内的思考をシミュレートするSentient Agentをインスタンス化する。
SAGEは、真に共感的で社会的に適応的な言語エージェントへの進捗を追跡するための、原則付き、スケーラブルで解釈可能なツールを提供する。
論文 参考訳(メタデータ) (2025-05-01T19:06:10Z) - Examining Identity Drift in Conversations of LLM Agents [5.12659586713042]
本研究では,9つの大言語モデル(LLM)におけるアイデンティティの整合性について検討する。
実験は、質的、定量的な方法で分析された、個人的なテーマに関するマルチターン会話を含む。
論文 参考訳(メタデータ) (2024-12-01T13:19:32Z) - SocialBench: Sociality Evaluation of Role-Playing Conversational Agents [85.6641890712617]
大規模言語モデル(LLM)は、様々なAI対話エージェントの開発を進めてきた。
SocialBenchは、ロールプレイングの会話エージェントの社会的性を個人レベルとグループレベルで評価するために設計された最初のベンチマークである。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文 参考訳(メタデータ) (2024-03-20T15:38:36Z) - Modeling Multimodal Social Interactions: New Challenges and Baselines with Densely Aligned Representations [20.848802791989307]
本稿では,複数の人物間の微粒化動態をモデル化するための3つの新しい課題を紹介する。
視覚特徴とそれに対応する発話を同期させることにより、密集した言語-視覚表現を活用する新しいマルチモーダルベースラインを提案する。
実験では, よりきめ細かい社会相互作用をモデル化する上で, 密集したマルチモーダル表現を用いた提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-03-04T14:46:58Z) - Learning Triadic Belief Dynamics in Nonverbal Communication from Videos [81.42305032083716]
非言語コミュニケーションはエージェント間で豊富な社会情報を伝達することができる。
本論文では,エージェントの精神状態を表現,モデル化,学習,推論するために,異なる非言語的コミュニケーションキューを組み込んだ。
論文 参考訳(メタデータ) (2021-04-07T00:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。