論文の概要: Modeling the Mental World for Embodied AI: A Comprehensive Review
- arxiv url: http://arxiv.org/abs/2601.02378v1
- Date: Wed, 17 Dec 2025 16:16:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.641735
- Title: Modeling the Mental World for Embodied AI: A Comprehensive Review
- Title(参考訳): 体操AIのためのメンタルワールドのモデリング:包括的レビュー
- Authors: Biyuan Liu, Daigang Xu, Lei Jiang, Wenjun Guo, Ping Chen,
- Abstract要約: このレビューでは、100以上の権威的研究を体系的に合成し、インボディードAIのためのメンタルワールドモデル(MWM)研究の包括的概要を提供する。
本研究は,人間社会へのエンボディエージェントの統合を促進し,人間と機械の相互作用の深層開発を進めることを目的としている。
- 参考スコア(独自算出の注目度): 4.168966214660401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the application of Embodied AI Agents in avatars, wearable devices, and robotic systems continues to deepen, their core research challenges have gradually shifted from physical environment interaction to the accurate understanding of social interactions. Traditional physical world models (PWM) focus on quantifiable physical attributes such as space and motion, failing to meet the needs of social intelligence modeling. In contrast, the Mental World Model (MWM), as a structured representation of humans' internal mental states, has become the critical cognitive foundation for embodied agents to achieve natural human-machine collaboration and dynamic social adaptation. However, current MWM research faces significant bottlenecks: such as fragmented conceptual framework with vague boundaries between MWM and PWM, disjointed reasoning mechanisms for the technical pathways and applicable scenarios of different Theory of Mind (ToM) reasoning paradigms, and detachment between evaluation and practice. To address these issues, this review systematically synthesizes over 100 authoritative studies to provide a comprehensive overview of MWM research for embodied AI. Its core contributions are threefold: First, it constructs a complete theoretical framework for MWM for the first time. Specifically, it distinguishes the essential differences between MWM and PWMs. Second, it systematically defines the key components of MWM through two paradigms for mental element representation. Third, it comprehensively analyzes two core ToM reasoning paradigms with 19 ToM methods. Finally, it also clarifies the integration trend of neuro-symbolic hybrid architectures, and synthesizes 26 ToM evaluation benchmarks. This work aims to promote the integration of embodied agents into human society and advance the in-depth development of human-machine collaborative interaction.
- Abstract(参考訳): アバター、ウェアラブルデバイス、ロボットシステムへのEmbodied AI Agentsの適用はますます深まり続けており、彼らの中核研究課題は、物理的環境相互作用から社会的相互作用の正確な理解へと徐々にシフトしている。
伝統的な物理世界モデル(PWM)は、空間や運動などの量的な物理的特性に焦点を合わせ、社会知性モデリングの必要性を満たさない。
対照的に、人間の内的精神状態の構造的表現としてのメンタル・ワールド・モデル(MWM)は、自然な人間と機械の協調と動的な社会適応を達成するために、エンボディエージェントにとって重要な認知基盤となっている。
しかし、現在のMWM研究は、MWMとPWMの境界があいまいな断片化された概念的枠組み、技術的経路の解離した推論機構、異なる心の理論(ToM)推論パラダイムの適用シナリオ、評価と実践の分離など、大きなボトルネックに直面している。
これらの問題に対処するために、このレビューは100以上の権威的研究を体系的に合成し、具体化されたAIのためのMWM研究の包括的概要を提供する。
まず、MWMの完全な理論的枠組みを初めて構築する。
具体的には、MWMとPWMの主な違いを区別する。
第2に、心的要素表現のための2つのパラダイムを通じて、MWMのキーコンポーネントを体系的に定義する。
第3に、19のToMメソッドで2つのコアToM推論パラダイムを包括的に分析する。
最後に、ニューロシンボリックハイブリッドアーキテクチャの統合傾向を明らかにし、26TOM評価ベンチマークを合成する。
本研究は,人間社会へのエンボディエージェントの統合を促進し,人間と機械の相互作用の深層開発を進めることを目的としている。
関連論文リスト
- A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms [49.66022971508878]
私たちは、推論はモジュラーコンポーネントからシステムの認知コアに高めるべきだと論じています。
応答性推論のトレードオフやソーシャルゲーム推論など,7つの中核的推論課題を導出し,体系化する。
我々は,LLMに基づく推論と,ミリ秒スケールで安全クリティカルな車両制御の要求との間の,高レイテンシ,熟考的特性の根本的かつ未解決な緊張関係を同定する。
論文 参考訳(メタデータ) (2026-03-11T07:40:53Z) - Approximating the Mathematical Structure of Psychodynamics [0.0]
我々は、プロセス理論のダイアグラム的枠組みを通じて人間の心理力学を定式化し、その重要な性質を説明し、心理療法、ニューロテクノロジー、AIアライメント、自律的な交渉における個人のAIエージェント表現、人間のようなAIシステムの開発、その他のAI安全性といった文脈における認知プロセスの分析において、ダイアグラム的表現と中心概念の関係を説明する。
論文 参考訳(メタデータ) (2025-11-05T03:38:09Z) - Foundation of Intelligence: Review of Math Word Problems from Human Cognition Perspective [90.193615160526]
数学語問題(MWP)は、1960年代までさかのぼる人工知能(AI)の基本的な研究トピックである。
この研究は、人間のような認知知性を反映することで、AIの推論能力を向上させることを目的としている。
本稿では,問題理解,論理的組織,連想記憶,批判思考,知識学習の5つの重要な認知能力について要約する。
論文 参考訳(メタデータ) (2025-10-24T20:06:15Z) - The Universal Landscape of Human Reasoning [60.72403709545137]
情報フロー追跡(IF-Track)を導入し,情報エントロピーの定量化と,各推論ステップにおけるゲインの定量化を行う。
IF-Trackは,本質的な推論特徴を捉え,系統的な誤りパターンを識別し,個人差を特徴付ける。
このアプローチは理論と測定の間の定量的な橋渡しを確立し、推論のアーキテクチャに関する機械的な洞察を提供する。
論文 参考訳(メタデータ) (2025-10-24T16:26:36Z) - World Models Should Prioritize the Unification of Physical and Social Dynamics [57.91940497010114]
本稿では、物理的・社会的予測能力の体系的・双方向統合が、世界モデル開発における次の重要なフロンティアであると主張している。
包括的世界モデルは、客観的物理法則を主観的、進化的、文脈に依存した社会力学の性質と一体的に統合する必要があると我々は主張する。
論文 参考訳(メタデータ) (2025-10-24T07:42:37Z) - Uni-MMMU: A Massive Multi-discipline Multimodal Unified Benchmark [69.8473923357969]
統一マルチモーダルモデルは、視覚的理解と生成を共同で行うことを目的としているが、現在のベンチマークでは、その真の統合を検査することはめったにない。
提案するUni-MMMUは、8つの推論中心領域にまたがる生成と理解の双方向の相乗効果を拡大する総合的なベンチマークである。
論文 参考訳(メタデータ) (2025-10-15T17:10:35Z) - DPMT: Dual Process Multi-scale Theory of Mind Framework for Real-time Human-AI Collaboration [16.556062956011054]
リアルタイム人間-人工知能(AI)コラボレーションは不可欠だが、難しい。
既存の言語モデル(LLM)エージェントは、複雑な人間の精神特性を正確にモデル化できないことが多い。
本稿では,新しいマルチスケール・プロセスのマインド・フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-18T17:13:21Z) - MetaMind: Modeling Human Social Thoughts with Metacognitive Multi-Agent Systems [17.381122321801556]
メタ認知の心理学理論に触発されたマルチエージェントフレームワークであるMetaMindを紹介する。
我々のフレームワークは3つの挑戦的なベンチマークで最先端のパフォーマンスを実現し、実世界の社会的シナリオは35.7%改善した。
この研究は、共感的対話や文化的に敏感な相互作用に応用して、人間のような社会知性に向けてAIシステムを前進させる。
論文 参考訳(メタデータ) (2025-05-25T02:32:57Z) - On the Emergence of Symmetrical Reality [51.21203247240322]
物理仮想アマルガメーションの様々な形態を包含した統一表現を提供する対称現実感フレームワークを導入する。
我々は、対称現実の潜在的な応用を示すAI駆動型アクティブアシストサービスの例を提案する。
論文 参考訳(メタデータ) (2024-01-26T16:09:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。