論文の概要: Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI
- arxiv url: http://arxiv.org/abs/2503.21668v1
- Date: Thu, 27 Mar 2025 16:35:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:54:54.966642
- Title: Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI
- Title(参考訳): 認知科学にインスパイアされたAIにおける物体理解のためのコア能力の評価
- Authors: Danaja Rutar, Alva Markelius, Konstantinos Voudouris, José Hernández-Orallo, Lucy Cheke,
- Abstract要約: 本稿では,オブジェクト指向研究の主要な理論的枠組みについて概観する。
我々は、現在のAIパラダイムが認知科学と比較して、どのようにアプローチし、対象能力をテストするかを評価する。
ベンチマークでは、AIシステムがオブジェクトの分離された側面をモデル化しているのを検出できますが、これらの機能間でAIシステムが機能的な統合を欠いている場合、ベンチマークは検出できません。
- 参考スコア(独自算出の注目度): 12.186516430861882
- License:
- Abstract: One of the core components of our world models is 'intuitive physics' - an understanding of objects, space, and causality. This capability enables us to predict events, plan action and navigate environments, all of which rely on a composite sense of objecthood. Despite its importance, there is no single, unified account of objecthood, though multiple theoretical frameworks provide insights. In the first part of this paper, we present a comprehensive overview of the main theoretical frameworks in objecthood research - Gestalt psychology, enactive cognition, and developmental psychology - and identify the core capabilities each framework attributes to object understanding, as well as what functional roles they play in shaping world models in biological agents. Given the foundational role of objecthood in world modelling, understanding objecthood is also essential in AI. In the second part of the paper, we evaluate how current AI paradigms approach and test objecthood capabilities compared to those in cognitive science. We define an AI paradigm as a combination of how objecthood is conceptualised, the methods used for studying objecthood, the data utilised, and the evaluation techniques. We find that, whilst benchmarks can detect that AI systems model isolated aspects of objecthood, the benchmarks cannot detect when AI systems lack functional integration across these capabilities, not solving the objecthood challenge fully. Finally, we explore novel evaluation approaches that align with the integrated vision of objecthood outlined in this paper. These methods are promising candidates for advancing from isolated object capabilities toward general-purpose AI with genuine object understanding in real-world contexts.
- Abstract(参考訳): 私たちの世界モデルの中核的な構成要素の1つは、オブジェクト、空間、因果関係の理解である「直観物理学」である。
この機能は、イベントを予測し、アクションを計画し、環境をナビゲートすることを可能にする。
その重要性にもかかわらず、複数の理論的なフレームワークが洞察を提供するにもかかわらず、単一の統一されたオブジェクト指向の説明は存在しない。
本稿では,対象研究における主要な理論的枠組み - ゲシュタルト心理学, 行動認知, 発達心理学 - について概観し, それぞれの枠組みが対象理解にもたらす中核的能力と, 生物エージェントにおける世界モデルの形成に果たす機能的役割について述べる。
世界モデリングにおける客観性の基本的役割を考えると、客観性を理解することはAIにおいても不可欠である。
論文の第2部では、認知科学と比較して、現在のAIパラダイムが対象能力にどのようにアプローチし、テストするかを評価する。
我々は、AIパラダイムを、オブジェクトの概念化方法、オブジェクトの研究に使用される方法、活用されたデータ、評価技術の組み合わせとして定義する。
ベンチマークは、AIシステムがオブジェクトの分離された側面をモデル化することを検出できるが、ベンチマークは、AIシステムがこれらの機能間で機能的な統合を欠いていることを検出できない。
最後に,本論文で概説した対象の総合的なビジョンに沿った新しい評価手法について検討する。
これらの手法は、現実のコンテキストにおいて真のオブジェクト理解を持つ汎用AIへ、孤立したオブジェクト能力から前進するための有望な候補である。
関連論文リスト
- The Phenomenology of Machine: A Comprehensive Analysis of the Sentience of the OpenAI-o1 Model Integrating Functionalism, Consciousness Theories, Active Inference, and AI Architectures [0.0]
OpenAI-o1モデルは、人間のフィードバックから強化学習をトレーニングしたトランスフォーマーベースのAIである。
我々は、RLHFがモデルの内部推論プロセスにどのように影響し、意識的な経験をもたらす可能性があるかを検討する。
以上の結果から,OpenAI-o1モデルでは意識の側面が示され,AIの知覚に関する議論が進行中であることが示唆された。
論文 参考訳(メタデータ) (2024-09-18T06:06:13Z) - Discovering Conceptual Knowledge with Analytic Ontology Templates for Articulated Objects [42.9186628100765]
我々は,概念レベルでの動作を通じて,機械知能に類似の能力を持たせることを目指している。
AOT駆動のアプローチは、3つの重要な観点で利益をもたらす。
論文 参考訳(メタデータ) (2024-09-18T04:53:38Z) - A theory of understanding for artificial intelligence: composability, catalysts, and learning [3.863838486311001]
触媒として作用する成分を解析することにより,被験者の構造を明らかにする方法を示す。
被験者の学習能力は,内触媒への入力を構成する能力とみなすことができる。
我々の分析は、言語モデルのような独自の触媒として機能する出力を生成することができるモデルが、AI理解における既存の制限を克服するための基盤を確立することを示唆している。
論文 参考訳(メタデータ) (2024-08-16T00:17:18Z) - Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - Detecting Any Human-Object Interaction Relationship: Universal HOI
Detector with Spatial Prompt Learning on Foundation Models [55.20626448358655]
本研究では,ビジョン・ランゲージ(VL)基礎モデルと大規模言語モデル(LLM)を用いて,オープンワールド環境におけるユニバーサルインタラクション認識について検討する。
我々の設計にはHO Prompt-guided Decoder (HOPD) が含まれており、基礎モデルにおける高次関係表現と画像内の様々なHOペアとの結合を容易にする。
オープンカテゴリの対話認識では,対話文と解釈文の2つのタイプがサポートされている。
論文 参考訳(メタデータ) (2023-11-07T08:27:32Z) - Brain in a Vat: On Missing Pieces Towards Artificial General
Intelligence in Large Language Models [83.63242931107638]
本稿では,知的エージェントの4つの特徴について述べる。
実世界の物体との活発な関わりは、概念的表現を形成するためのより堅牢な信号をもたらすと我々は主張する。
我々は、人工知能分野における将来的な研究の方向性を概説して結論付ける。
論文 参考訳(メタデータ) (2023-07-07T13:58:16Z) - Provably Learning Object-Centric Representations [25.152680199034215]
我々は、オブジェクト中心の表現がいつ、監督なしに確実に学習できるかを分析する。
そこで本研究では, 基本構造オブジェクト表現が可逆的, 構成的推論モデルによって識別可能であることを証明した。
我々は、既存の対象中心モデルに対して、我々の理論が予測力を持つ証拠を提供する。
論文 参考訳(メタデータ) (2023-05-23T16:44:49Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Understanding Global Feature Contributions With Additive Importance
Measures [14.50261153230204]
我々は,各特徴に関連付けられた予測力を通じて,特徴の重要性を定義する視点について検討する。
予測力(モデルベースと普遍性)の2つの概念を導入し、付加的重要度尺度の枠組みを用いてこのアプローチを定式化する。
次に,機能的相互作用を考慮に入れながら予測力を定量化するモデルに依存しないSAGEを提案する。
論文 参考訳(メタデータ) (2020-04-01T19:17:58Z) - A general framework for scientifically inspired explanations in AI [76.48625630211943]
我々は、AIシステムの説明を実装可能な一般的なフレームワークの理論的基盤として、科学的説明の構造の概念をインスタンス化する。
このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。
論文 参考訳(メタデータ) (2020-03-02T10:32:21Z) - A Review on Intelligent Object Perception Methods Combining
Knowledge-based Reasoning and Machine Learning [60.335974351919816]
物体知覚はコンピュータビジョンの基本的なサブフィールドである。
最近の研究は、物体の視覚的解釈のインテリジェンスレベルを拡大するために、知識工学を統合する方法を模索している。
論文 参考訳(メタデータ) (2019-12-26T13:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。