論文の概要: DPMT: Dual Process Multi-scale Theory of Mind Framework for Real-time Human-AI Collaboration
- arxiv url: http://arxiv.org/abs/2507.14088v1
- Date: Fri, 18 Jul 2025 17:13:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.372016
- Title: DPMT: Dual Process Multi-scale Theory of Mind Framework for Real-time Human-AI Collaboration
- Title(参考訳): DPMT:リアルタイムAIコラボレーションのためのマインドフレームワークのデュアルプロセスマルチスケール理論
- Authors: Xiyun Li, Yining Ding, Yuhua Jiang, Yunlong Zhao, Runpeng Xie, Shuang Xu, Yuanhua Ni, Yiqin Yang, Bo Xu,
- Abstract要約: リアルタイム人間-人工知能(AI)コラボレーションは不可欠だが、難しい。
既存の言語モデル(LLM)エージェントは、複雑な人間の精神特性を正確にモデル化できないことが多い。
本稿では,新しいマルチスケール・プロセスのマインド・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.556062956011054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time human-artificial intelligence (AI) collaboration is crucial yet challenging, especially when AI agents must adapt to diverse and unseen human behaviors in dynamic scenarios. Existing large language model (LLM) agents often fail to accurately model the complex human mental characteristics such as domain intentions, especially in the absence of direct communication. To address this limitation, we propose a novel dual process multi-scale theory of mind (DPMT) framework, drawing inspiration from cognitive science dual process theory. Our DPMT framework incorporates a multi-scale theory of mind (ToM) module to facilitate robust human partner modeling through mental characteristic reasoning. Experimental results demonstrate that DPMT significantly enhances human-AI collaboration, and ablation studies further validate the contributions of our multi-scale ToM in the slow system.
- Abstract(参考訳): リアルタイム人間-人工知能(AI)コラボレーションは、特にAIエージェントが動的シナリオにおいて多様で目に見えない人間の振る舞いに適応しなければならない場合、非常に難しい。
既存の言語モデル(LLM)エージェントは、特に直接コミュニケーションがない場合に、ドメインの意図のような複雑な人間の精神特性を正確にモデル化できないことが多い。
この制限に対処するために、認知科学の二重プロセス理論からインスピレーションを得た、新しい二重プロセス多スケール心論(DPMT)フレームワークを提案する。
我々のDPMTフレームワークは、精神特性推論による堅牢な人間パートナーモデリングを容易にするために、マルチスケールの心の理論(ToM)モジュールを組み込んでいる。
実験の結果,DPMTは人間とAIのコラボレーションを著しく促進し,低速システムにおけるマルチスケールToMの貢献度をさらに向上することが示された。
関連論文リスト
- MOMENTS: A Comprehensive Multimodal Benchmark for Theory of Mind [28.25540132218273]
心の理論は、社会的にインテリジェントなマルチモーダルエージェントを構築するために不可欠である。
マルチモーダルな大規模言語モデルのToM能力を評価するためのベンチマークであるMOMENTSを紹介する。
論文 参考訳(メタデータ) (2025-07-06T15:06:30Z) - Algorithmic Prompt Generation for Diverse Human-like Teaming and Communication with Large Language Models [14.45823275027527]
品質多様性(QD)最適化は、多様な強化学習(RL)エージェントの振る舞いを生成することができる。
我々はまず、人間-物体実験を通して、人間がこの領域で様々な協調行動とコミュニケーション行動を示すことを示す。
そして、我々の手法は、人間のチームデータからトレンドを効果的に再現し、観察できない振る舞いを捉えることができることを示す。
論文 参考訳(メタデータ) (2025-04-04T23:09:40Z) - DMWM: Dual-Mind World Model with Long-Term Imagination [53.98633183204453]
本稿では、論理的推論を統合し、論理的一貫性で想像力を発揮できる新しいデュアルミンド世界モデル(DMWM)を提案する。
提案するフレームワークは,DMControlスイートからの長期計画を必要とするベンチマークタスクに基づいて評価される。
論文 参考訳(メタデータ) (2025-02-11T14:40:57Z) - Towards a Formal Theory of the Need for Competence via Computational Intrinsic Motivation [6.593505830504729]
人工知能から得られるフォーマリズムは、どのようにして肥大した出発点を提供するかを示す。
我々は,自己決定理論における「能力の必要性」に焦点をあてる。
これらの定式化を用いて、SDTが明示に失敗する前提条件を明らかにする。
論文 参考訳(メタデータ) (2025-02-11T10:03:40Z) - Humanlike Cognitive Patterns as Emergent Phenomena in Large Language Models [2.9312156642007294]
我々は、意思決定バイアス、推論、創造性の3つの重要な認知領域にわたって、大規模言語モデルの能力を体系的にレビューする。
意思決定では、LSMはいくつかの人間のようなバイアスを示すが、人間の観察するバイアスは欠落している。
GPT-4のような先進的なLCMは、人間のシステム2思考に似た熟考的推論を示し、小さなモデルは人間レベルの性能に欠ける。
LLMはストーリーテリングのような言語ベースの創造的なタスクに優れているが、現実の文脈を必要とする散発的な思考タスクに苦労する。
論文 参考訳(メタデータ) (2024-12-20T02:26:56Z) - Mutual Theory of Mind in Human-AI Collaboration: An Empirical Study with LLM-driven AI Agents in a Real-time Shared Workspace Task [56.92961847155029]
心の理論(ToM)は、他人を理解する上で重要な能力として、人間の協調とコミュニケーションに大きな影響を及ぼす。
Mutual Theory of Mind (MToM) は、ToM能力を持つAIエージェントが人間と協力するときに発生する。
エージェントのToM能力はチームのパフォーマンスに大きな影響を与えず,エージェントの人間的理解を高めていることがわかった。
論文 参考訳(メタデータ) (2024-09-13T13:19:48Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Explicit Modelling of Theory of Mind for Belief Prediction in Nonverbal Social Interactions [9.318796743761224]
マルチモーダル入力から人間の社会的相互作用における信念とそのダイナミクスを予測するための、心の理論(ToM)ニューラルネットワークであるMToMnetを提案する。
MToMnetはコンテキストキューを符号化し、個人固有のキュー(人間の視線とボディランゲージ)を、それぞれ個別のMindNetに統合する。
以上の結果から,MToMnetは既存の手法をはるかに上回り,同時にパラメータも大幅に少なくなることが明らかとなった。
論文 参考訳(メタデータ) (2024-07-09T11:15:51Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - Mixture of personality improved Spiking actor network for efficient
multi-agent cooperation [8.458376803715788]
認知心理学におけるパーソナリティ理論は、人間がまず他人の個性を予測し、次に複雑な行動によって協調課題をうまく扱えることを記述している。
この2段階の心理学理論に着想を得て, スパイキング・アクターネットワーク(SAN)を改良した, 生物学的に妥当なパーソナリティ混合(MoP)を提案する。
提案したMoP-SANを試験するために,協調調理の強い要件を含むベンチマークオーバークッキングタスクを選択した。
論文 参考訳(メタデータ) (2023-05-10T05:01:59Z) - Machine Psychology [54.287802134327485]
我々は、心理学にインスパイアされた行動実験において、研究のための実りある方向が、大きな言語モデルに係わっていると論じる。
本稿では,本手法が表に示す理論的視点,実験パラダイム,計算解析技術について述べる。
これは、パフォーマンスベンチマークを超えた、生成人工知能(AI)のための「機械心理学」の道を開くものだ。
論文 参考訳(メタデータ) (2023-03-24T13:24:41Z) - Multimodal foundation models are better simulators of the human brain [65.10501322822881]
1500万の画像テキストペアを事前訓練した,新たに設計されたマルチモーダル基礎モデルを提案する。
視覚的エンコーダも言語的エンコーダもマルチモーダルで訓練され,脳に近いことが判明した。
論文 参考訳(メタデータ) (2022-08-17T12:36:26Z) - DIME: Fine-grained Interpretations of Multimodal Models via Disentangled
Local Explanations [119.1953397679783]
我々は,マルチモーダルモデルの解釈における最先端化に注力する。
提案手法であるDIMEは,マルチモーダルモデルの高精度かつきめ細かな解析を可能にする。
論文 参考訳(メタデータ) (2022-03-03T20:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。