論文の概要: Think Thrice Before You Speak: Dual knowledge-enhanced Theory-of-Mind Reasoning for Persuasive Agents
- arxiv url: http://arxiv.org/abs/2605.22602v1
- Date: Thu, 21 May 2026 15:15:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.591109
- Title: Think Thrice Before You Speak: Dual knowledge-enhanced Theory-of-Mind Reasoning for Persuasive Agents
- Title(参考訳): 言葉を話す前に考える: 説得力のあるエージェントのための二重知識強化理論
- Authors: Minghui Ma, Bin Guo, Runze Yang, Mengqi Chen, Yan Liu, Jingqi Liu, Yahan Pei, Xuehao Ma, Qiuyun Zhang, Zhiwen Yu,
- Abstract要約: 本稿では,ToM-based Persuasive Dialogue (ToM-PD) タスクを紹介する。
また、知識に富んだ段階的推論フレームワークであるThink Thrice Before You Speak (TTBYS)を提案する。
- 参考スコア(独自算出の注目度): 11.724088361457419
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persuasive dialogue requires reasoning about others' latent mental states, a capability known as Theory of Mind (ToM). However, due to reliance on simple prompting strategies and insufficient ToM knowledge, existing LLMs often fail to capture the intrinsic dependencies among mental states, leading to fragmented representations and unstable reasoning. To address these challenges, we introduce the ToM-based Persuasive Dialogue (ToM-PD) task, grounded in the Belief-Desire-Intention (BDI) framework, which explicitly models the sequential dependencies among mental states in multi-turn dialogues. To facilitate research on this task, we construct a large-scale annotated dataset, ToM-based Broad Persuasive Dialogues (ToM-BPD), capturing fine-grained mental states and corresponding persuasive strategies. We further propose Think Thrice Before You Speak (TTBYS), a knowledge-enhanced stepwise reasoning framework that leverages both explicit and implicit prior experiences to improve LLMs' inference of desires, beliefs, and persuasive strategies. Experimental results demonstrate that Qwen3-8B equipped with TTBYS outperforms GPT-5 by 1.20%, 22.80%, and 16.97% in predicting desires, beliefs, and persuasive strategies, respectively. Case studies further show that our approach enhances interpretability and consistency in reasoning.
- Abstract(参考訳): 説得的対話は、他人の潜伏した精神状態、すなわち「心の理論」(ToM)と呼ばれる能力について推論する必要がある。
しかし、単純なプロンプト戦略とToMの知識不足により、既存のLSMは精神状態間の本質的な依存関係を捉えず、断片化された表現と不安定な推論に繋がる。
これらの課題に対処するために,マルチターン対話におけるメンタル状態間の逐次的依存関係を明示的にモデル化するBDI(Belief-Desire-Intention)フレームワークを基盤としたToM-PD(Persuasive Dialogue)タスクを導入する。
本研究では,ToM-BPDをベースとした大規模アノテートデータセットを構築し,微粒な精神状態とそれに対応する説得戦略を把握した。
さらに,LLMの欲求,信念,説得的戦略の推論を改善するために,明示的および暗黙的な事前経験の両方を活用する知識に富んだ段階的推論フレームワークであるThink Thrice Before You Speak (TTBYS)を提案する。
TTBYSを搭載したQwen3-8Bは、それぞれ欲求、信念、説得戦略の予測において、GPT-5の1.20%、22.80%、および16.97%を上回っている。
事例研究により,本手法は推論における解釈可能性や一貫性を高めることが示唆された。
関連論文リスト
- MA$^{2}$P: A Meta-Cognitive Autonomous Intelligent Agents Framework for Complex Persuasion [34.431254321873794]
複雑な説得のためのメタ認知型自律型インテリジェントエージェントフレームワークであるMA$2$Pを提案する。
具体的には、認識管理、精神状態推論、戦略実行、記憶維持、評価を協調する自律型マルチエージェントアーキテクチャを開発する。
我々のアプローチはベースラインよりも高い説得率を達成する。
論文 参考訳(メタデータ) (2026-05-18T15:53:12Z) - MMPersuade: A Dataset and Evaluation Framework for Multimodal Persuasion [73.99171322670772]
LVLM(Large Vision-Language Models)は、ショッピング、健康、ニュースなどの分野に展開されている。
MMPersuadeはLVLMにおけるマルチモーダルパーサージョンダイナミクスを体系的に研究するための統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-10-26T17:39:21Z) - Disagreements in Reasoning: How a Model's Thinking Process Dictates Persuasion in Multi-Agent Systems [49.69773210844221]
本稿では,説得力はモデルスケールの関数である,という一般的な仮説に挑戦する。
一連のマルチエージェントの説得実験を通じて、パーサーション・デュナリティ(Persuasion Duality)と呼ばれる基本的なトレードオフを明らかにする。
以上の結果から, LRMの推理過程は説得に対する抵抗性が大きく, 当初の信念をより堅固に維持していることが明らかとなった。
論文 参考訳(メタデータ) (2025-09-25T12:03:10Z) - Persuasion Should be Double-Blind: A Multi-Domain Dialogue Dataset With Faithfulness Based on Causal Theory of Mind [21.022976907694265]
最近の説得的対話データセットは、実世界の対人インタラクションと一致しないことが多い。
ToMMAは、心の因果理論によって導かれる対話生成のための新しいマルチエージェントフレームワークである。
マルチドメイン・マルチターン・パーサッシブ・ダイアログ・データセットであるCTOMPersuを提案する。
論文 参考訳(メタデータ) (2025-02-28T18:28:16Z) - PersuasiveToM: A Benchmark for Evaluating Machine Theory of Mind in Persuasive Dialogues [27.231701486961917]
本稿では,大規模言語モデルのマインド能力理論を評価するためのベンチマークであるPersuasiveToMを提案する。
フレームワークには、ToM ReasoningとToM Applicationという2つのコアタスクが含まれています。
PersuasiveToMの目的は、複雑な心理的活動に焦点を当てたLSMのToM推論能力を効果的に評価することである。
論文 参考訳(メタデータ) (2025-02-28T13:04:04Z) - What if...?: Thinking Counterfactual Keywords Helps to Mitigate Hallucination in Large Multi-modal Models [50.97705264224828]
大規模マルチモーダルモデルに反現実的思考を組み込む新しい手法である反現実的インセプションを提案する。
我々は、より広い文脈のシーン理解にまたがる応答をモデルが関与し、生成することを目指している。
オープンソースモデルとプロプライエタリモデルの両方を含む様々なLMMの包括的分析は、反事実的思考が幻覚を著しく減少させることを裏付ける。
論文 参考訳(メタデータ) (2024-03-20T11:27:20Z) - Igniting Language Intelligence: The Hitchhiker's Guide From
Chain-of-Thought Reasoning to Language Agents [80.5213198675411]
大規模言語モデル(LLM)は言語知能の分野を劇的に拡張した。
LLMは興味をそそるチェーン・オブ・シークレット(CoT)推論技術を活用し、答えを導き出す途中の中間ステップを定式化しなければならない。
最近の研究は、自律言語エージェントの開発を促進するためにCoT推論手法を拡張している。
論文 参考訳(メタデータ) (2023-11-20T14:30:55Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - Re-Reading Improves Reasoning in Large Language Models [87.46256176508376]
既成のLarge Language Models (LLM) の推論能力を高めるため, 単純で汎用的で効果的なプロンプト手法であるRe2を導入する。
CoT (Chain-of-Thought) など、ほとんどの思考を刺激する手法とは異なり、Re2 は質問を2回処理することで入力に焦点を移し、理解プロセスを強化する。
提案手法の有効性と汎用性を検証するため,14のデータセットにまたがる広範囲な推論ベンチマークでRe2を評価した。
論文 参考訳(メタデータ) (2023-09-12T14:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。