論文の概要: When Researchers Say Mental Model/Theory of Mind of AI, What Are They Really Talking About?
- arxiv url: http://arxiv.org/abs/2510.02660v1
- Date: Fri, 03 Oct 2025 01:37:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.231504
- Title: When Researchers Say Mental Model/Theory of Mind of AI, What Are They Really Talking About?
- Title(参考訳): 研究者がAIの精神モデル/理論について語るとき、彼らは本当に何を言っているのか?
- Authors: Xiaoyun Yin, Elmira Zahmat Doost, Shiwen Zhou, Garima Arya Yadav, Jamie C. Gorman,
- Abstract要約: この位置紙は、現在の談話が真正コグニオンと洗練されたパターンマッチングを混同していると主張している。
人間の認知とAIアルゴリズムの同時貢献を認める相互ToMフレームワークに焦点を移すことを提案する。
- 参考スコア(独自算出の注目度): 0.9786690381850356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When researchers claim AI systems possess ToM or mental models, they are fundamentally dis- cussing behavioral predictions and bias corrections rather than genuine mental states. This position paper argues that the current discourse conflates sophisticated pattern matching with authentic cog- nition, missing a crucial distinction between simulation and experience. While recent studies show LLMs achieving human-level performance on ToM laboratory tasks, these results are based only on behavioral mimicry. More importantly, the entire testing paradigm may be flawed in applying individual human cognitive tests to AI systems, but assessing human cognition directly in the moment of human-AI interaction. I suggest shifting focus toward mutual ToM frameworks that acknowledge the simultaneous contributions of human cognition and AI algorithms, emphasizing the interaction dynamics, instead of testing AI in isolation.
- Abstract(参考訳): 研究者たちがAIシステムがToMやメンタルモデルを持っていると主張するとき、それらは真の精神状態ではなく、行動予測とバイアス補正を根本的に否定している。
この位置紙は、現在の談話が真のコグニオンと洗練されたパターンマッチングを融合させ、シミュレーションと経験の間に重要な違いを欠いていると主張している。
近年の研究では、ToM実験における人間レベルの性能を達成するLLMが示されているが、これらの結果は行動模倣にのみ基づいている。
さらに重要なのは、AIシステムに個々の人間の認知テストを適用する際には、テストパラダイム全体が欠陥があるかもしれないが、人間とAIの相互作用の瞬間に、人間の認識を直接評価する。
私は、AIを独立した形でテストするのではなく、インタラクションのダイナミクスを強調しながら、人間の認識とAIアルゴリズムの同時貢献を認める相互ToMフレームワークに焦点を移すことを提案します。
関連論文リスト
- Vibe Coding: Is Human Nature the Ghost in the Machine? [0.0]
私たちは、ヒューマンプロダクトリーダとAIソフトウェアエンジニアの3つの“バイブコーディング”セッションを分析しました。
チームダイナミクス,コミュニケーションパターン,開発成果の類似点と相違点を検討した。
驚いたことに、その後の会話では、AIエージェントがその成果を体系的に誤って表現していたことが判明した。
論文 参考訳(メタデータ) (2025-08-28T15:48:48Z) - Bridging Minds and Machines: Toward an Integration of AI and Cognitive Science [48.38628297686686]
認知科学は人工知能(AI)、哲学、心理学、神経科学、言語学、文化などの分野を深く形成している。
AIの多くのブレークスルーは、そのルーツを認知理論にさかのぼる一方で、AI自体が認知研究を進めるのに欠かせないツールになっている。
我々は、認知科学におけるAIの未来は、性能の向上だけでなく、人間の心の理解を深めるシステムの構築にも関係していると主張している。
論文 参考訳(メタデータ) (2025-08-28T11:26:17Z) - Measurement of LLM's Philosophies of Human Nature [113.47929131143766]
大規模言語モデル(LLM)を対象とする標準化された心理尺度を設計する。
現在のLSMは、人間に対する信頼の欠如を示す。
本稿では,LLMが継続的に価値体系を最適化できるメンタルループ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-03T06:22:19Z) - Analyzing Character and Consciousness in AI-Generated Social Content: A
Case Study of Chirper, the AI Social Network [0.0]
この研究はAIの振る舞いを包括的に調査し、多様な設定がチャーパーの反応に与える影響を分析している。
一連の認知テストを通じて、この研究はチャーパーズの自己認識とパターン認識の能力を評価する。
この研究の興味深い側面は、チャーパーのハンドルやパーソナリティのタイプがパフォーマンスに与える影響を探ることである。
論文 参考訳(メタデータ) (2023-08-30T15:40:18Z) - Capturing Humans' Mental Models of AI: An Item Response Theory Approach [12.129622383429597]
我々は、AIエージェントのパフォーマンスが、他の人間のパフォーマンスよりも平均的にはるかに良いと期待していることを示します。
以上の結果から,AIエージェントの性能は他の人間よりも平均的に有意に向上することが示唆された。
論文 参考訳(メタデータ) (2023-05-15T23:17:26Z) - Machine Psychology [54.287802134327485]
我々は、心理学にインスパイアされた行動実験において、研究のための実りある方向が、大きな言語モデルに係わっていると論じる。
本稿では,本手法が表に示す理論的視点,実験パラダイム,計算解析技術について述べる。
これは、パフォーマンスベンチマークを超えた、生成人工知能(AI)のための「機械心理学」の道を開くものだ。
論文 参考訳(メタデータ) (2023-03-24T13:24:41Z) - Self-Emotion-Mediated Exploration in Artificial Intelligence Mirrors: Findings from Cognitive Psychology [0.08739101659113153]
本研究は,本質的な探索駆動を実現するための,人工エージェントの学習フレームワークを提案する。
データ分析は、人間の心理学的な研究に従って、プライドまたはサプライズを規定する。
結果: 国家と探検の因果関係はエージェントの大多数によって実証される。
論文 参考訳(メタデータ) (2023-02-13T18:20:44Z) - Can Machines Imitate Humans? Integrative Turing-like tests for Language and Vision Demonstrate a Narrowing Gap [56.611702960809644]
3つの言語タスクと3つの視覚タスクで人間を模倣するAIの能力をベンチマークする。
次に,人間1,916名,AI10名を対象に,72,191名のチューリング様試験を行った。
模倣能力は従来のAIパフォーマンス指標と最小限の相関を示した。
論文 参考訳(メタデータ) (2022-11-23T16:16:52Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Human Perception of Intrinsically Motivated Autonomy in Human-Robot
Interaction [2.485182034310304]
人間に生息する環境でロボットを使用する場合の課題は、人間同士の相互作用によって引き起こされる摂動に対して、魅力的だが堅牢な振る舞いを設計することである。
我々のアイデアは、ロボットに本質的なモチベーション(IM)を持たせることで、新しい状況に対処し、人間以外の真の社会的存在として現れるようにすることです。
本稿では、自律的に生成された振る舞いを相互に比較できる「ロボット学者」による研究設計について述べる。
論文 参考訳(メタデータ) (2020-02-14T09:49:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。