論文の概要: A Review on Machine Theory of Mind
- arxiv url: http://arxiv.org/abs/2303.11594v1
- Date: Tue, 21 Mar 2023 04:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 16:29:55.931866
- Title: A Review on Machine Theory of Mind
- Title(参考訳): マシン・オブ・マインド理論の概観
- Authors: Yuanyuan Mao, Shuang Liu, Pengshuai Zhao, Qin Ni, Xin Lin and Liang He
- Abstract要約: 心の理論(りょうがく、英: Theory of Mind、ToM)とは、人間の認知の基盤である他者に対する精神状態の属性付け能力である。
本稿では,機械ToMにおける信念,欲求,意図に関する最近の進歩を概観する。
- 参考スコア(独自算出の注目度): 16.967933605635203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Theory of Mind (ToM) is the ability to attribute mental states to others, the
basis of human cognition. At present, there has been growing interest in the AI
with cognitive abilities, for example in healthcare and the motoring industry.
Beliefs, desires, and intentions are the early abilities of infants and the
foundation of human cognitive ability, as well as for machine with ToM. In this
paper, we review recent progress in machine ToM on beliefs, desires, and
intentions. And we shall introduce the experiments, datasets and methods of
machine ToM on these three aspects, summarize the development of different
tasks and datasets in recent years, and compare well-behaved models in aspects
of advantages, limitations and applicable conditions, hoping that this study
can guide researchers to quickly keep up with latest trend in this field.
Unlike other domains with a specific task and resolution framework, machine ToM
lacks a unified instruction and a series of standard evaluation tasks, which
make it difficult to formally compare the proposed models. We argue that, one
method to address this difficulty is now to present a standard assessment
criteria and dataset, better a large-scale dataset covered multiple aspects of
ToM.
- Abstract(参考訳): 心の理論(りょうがく、英: Theory of Mind、ToM)とは、人間の認知の基礎である他者に対する精神状態の属性付け能力である。
現在では、医療や自動車業界など、認知能力を備えたAIへの関心が高まっている。
信仰、欲求、意図は幼児の早期能力と人間の認知能力の基礎であり、ToMを用いた機械である。
本稿では,機械ToMにおける信念,欲求,意図に関する最近の進歩を概観する。
そして、これらの3つの側面について、機械学習ToMの実験、データセット、方法を紹介し、近年のさまざまなタスクやデータセットの開発を要約し、この研究が研究者にこの分野の最新トレンドを早急に追いつこうと期待して、利点、限界、および適用可能な条件の面において、優れたモデルを比較する。
特定のタスクと解決フレームワークを持つ他のドメインとは異なり、マシンToMは統一的な命令と一連の標準評価タスクを欠いているため、提案されたモデルを正式に比較することは困難である。
この困難に対処する1つの方法は、標準評価基準とデータセットを示し、tomの複数の側面をカバーする大規模データセットをより良くすることです。
関連論文リスト
- MFE-ETP: A Comprehensive Evaluation Benchmark for Multi-modal Foundation Models on Embodied Task Planning [50.45558735526665]
具体的タスクプランニングにおけるMFMの性能について,より深く,包括的に評価する。
我々は,その複雑で可変なタスクシナリオを特徴付けるMFE-ETPという新しいベンチマークを提案する。
ベンチマークと評価プラットフォームを用いて、いくつかの最先端のMFMを評価し、それらが人間レベルの性能に著しく遅れていることを発見した。
論文 参考訳(メタデータ) (2024-07-06T11:07:18Z) - NegotiationToM: A Benchmark for Stress-testing Machine Theory of Mind on Negotiation Surrounding [55.38254464415964]
現在、マインド評価の理論は、機械生成データやゲーム設定を用いたテストモデルに焦点を合わせており、ショートカットや素早い相関が生じる傾向にある。
我々は,多次元精神状態を取り巻く実世界の交渉において,ストレステストマシンToMのための新しいベンチマークであるNegotiationToMを紹介する。
論文 参考訳(メタデータ) (2024-04-21T11:51:13Z) - BDIQA: A New Dataset for Video Question Answering to Explore Cognitive
Reasoning through Theory of Mind [21.806678376095576]
心の理論(ToM)は、AIをより人間の思考プロセスによく似ている。
ビデオ質問応答(Video QA)データセットは、人間のToMを真に取り入れたイベントの因果推論を研究することに焦点を当てている。
本稿では,ToMの文脈におけるビデオQAモデルの認知的推論能力に関する最初のベンチマークであるBDIQAを提案する。
論文 参考訳(メタデータ) (2024-02-12T04:34:19Z) - MMToM-QA: Multimodal Theory of Mind Question Answering [80.87550820953236]
心の理論 (ToM) は人間レベルの社会知能を持つ機械を開発する上で不可欠な要素である。
最近の機械学習モデル、特に大きな言語モデルは、ToM理解のいくつかの側面を示しているようだ。
一方、ヒューマンToMはビデオやテキストの理解以上のものです。
人は、利用可能なデータから抽出された概念的表現に基づいて、他人の心について柔軟に推論することができる。
論文 参考訳(メタデータ) (2024-01-16T18:59:24Z) - Think Twice: Perspective-Taking Improves Large Language Models'
Theory-of-Mind Capabilities [63.90227161974381]
SimToMは、シミュレーション理論の視点取りの概念にインスパイアされた、新しいプロンプトフレームワークである。
我々のアプローチは、追加のトレーニングや最小限のプロンプトチューニングを必要とせず、既存の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-11-16T22:49:27Z) - Towards A Holistic Landscape of Situated Theory of Mind in Large
Language Models [14.491223187047378]
大言語モデル(LLM)は、心の理論(ToM)の出現の可能性について、かなりの関心と議論を巻き起こしている。
最近のいくつかの調査では、これらのモデルに堅牢なToMが欠如していることが判明し、新しいベンチマークの開発に対する需要が高まっている。
マシンToMを7つのメンタルステートカテゴリに分類し、既存のベンチマークをデライン化して、探索されていないToMの側面を特定します。
論文 参考訳(メタデータ) (2023-10-30T15:12:09Z) - Clever Hans or Neural Theory of Mind? Stress Testing Social Reasoning in
Large Language Models [82.50173296858377]
多くの逸話例は、ChatGPTやGPT-4のような新しい大規模言語モデル(LLM)が、N-ToM(Neural Theory-of-Mind)を示すことを示唆するために使用された。
我々は,LLMsのN-ToMの範囲を6つのタスクに対して広範囲に評価することにより検討し,LLMsが特定のN-ToM能力を示す一方で,この挙動は堅牢性には程遠いことを見出した。
論文 参考訳(メタデータ) (2023-05-24T06:14:31Z) - Machine Psychology [54.287802134327485]
我々は、心理学にインスパイアされた行動実験において、研究のための実りある方向が、大きな言語モデルに係わっていると論じる。
本稿では,本手法が表に示す理論的視点,実験パラダイム,計算解析技術について述べる。
これは、パフォーマンスベンチマークを超えた、生成人工知能(AI)のための「機械心理学」の道を開くものだ。
論文 参考訳(メタデータ) (2023-03-24T13:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。