論文の概要: Goals and the Structure of Experience
- arxiv url: http://arxiv.org/abs/2508.15013v1
- Date: Wed, 20 Aug 2025 19:05:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.07125
- Title: Goals and the Structure of Experience
- Title(参考訳): ゴールと経験の構造
- Authors: Nadav Amir, Stas Tiomkin, Angela Langdon,
- Abstract要約: 本稿では,認知エージェントにおける目標指向状態表現の計算フレームワークについて述べる。
目的と等価な経験分布のクラスとして定義された,目標指向(telic)状態の構成を導入する。
- 参考スコア(独自算出の注目度): 3.072340427031969
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Purposeful behavior is a hallmark of natural and artificial intelligence. Its acquisition is often believed to rely on world models, comprising both descriptive (what is) and prescriptive (what is desirable) aspects that identify and evaluate state of affairs in the world, respectively. Canonical computational accounts of purposeful behavior, such as reinforcement learning, posit distinct components of a world model comprising a state representation (descriptive aspect) and a reward function (prescriptive aspect). However, an alternative possibility, which has not yet been computationally formulated, is that these two aspects instead co-emerge interdependently from an agent's goal. Here, we describe a computational framework of goal-directed state representation in cognitive agents, in which the descriptive and prescriptive aspects of a world model co-emerge from agent-environment interaction sequences, or experiences. Drawing on Buddhist epistemology, we introduce a construct of goal-directed, or telic, states, defined as classes of goal-equivalent experience distributions. Telic states provide a parsimonious account of goal-directed learning in terms of the statistical divergence between behavioral policies and desirable experience features. We review empirical and theoretical literature supporting this novel perspective and discuss its potential to provide a unified account of behavioral, phenomenological and neural dimensions of purposeful behaviors across diverse substrates.
- Abstract(参考訳): 目的的行動は、自然と人工知能の目印である。
その獲得は世界の状況を特定し評価する記述的(何が望ましい)側面と規範的(何が望ましい)側面の両方を含む世界モデルに依存しているとしばしば信じられている。
強化学習のような目的的行動の標準的な計算的説明は、状態表現(記述的側面)と報酬関数(記述的側面)からなる世界モデルの異なる構成要素を定めている。
しかし、まだ計算学的に定式化されていない別の可能性として、これらの2つの側面がエージェントの目標と相互に共存することがある。
本稿では,認知エージェントにおける目標指向状態表現の計算フレームワークについて述べる。世界モデルの記述的・規範的側面は,エージェント-環境相互作用シーケンスや経験と共起する。
仏教の認識論に基づいて,目標と等価な経験分布のクラスとして定義された,目標指向(telic)状態の構成を導入する。
テクスト国家は、行動政策と望ましい経験特徴の間の統計的差異の観点から、目標指向学習の同義的な説明を提供する。
本稿は, この新たな視点を支持する実証的・理論的文献をレビューし, 多様な基質にまたがる目的行動の行動, 現象学的, 神経的次元を統一的に把握する可能性について論じる。
関連論文リスト
- Goal-Directedness is in the Eye of the Beholder [48.937781898861815]
ゴール指向の行動の探索には,2つのフレーバーがある。
エージェントシステムにおけるゴールの定式化から生じる技術的および概念的問題を特定する。
本稿では,動的マルチエージェントシステムの創発的特性として,ゴール指向性をモデル化するための新たな方向性について概説する。
論文 参考訳(メタデータ) (2025-08-18T11:04:18Z) - Cognitive Science-Inspired Evaluation of Core Capabilities for Object Understanding in AI [12.186516430861882]
本稿では,オブジェクト指向研究の主要な理論的枠組みについて概観する。
我々は、現在のAIパラダイムが認知科学と比較して、どのようにアプローチし、対象能力をテストするかを評価する。
ベンチマークでは、AIシステムがオブジェクトの分離された側面をモデル化しているのを検出できますが、これらの機能間でAIシステムが機能的な統合を欠いている場合、ベンチマークは検出できません。
論文 参考訳(メタデータ) (2025-03-27T16:35:02Z) - Disentangling Representations through Multi-task Learning [0.0]
分類タスクを最適に解決するエージェントにおいて,不整合表現の出現を保証する実験および理論的結果を提供する。
マルチタスクに訓練されたRNNにおいて、これらの予測を実験的に検証し、連続的な誘引子の形で非絡み合った表現を学習する。
私たちは、トランスフォーマーが特に、そのユニークな世界理解能力を説明するような、無関係な表現に向いていることに気付きました。
論文 参考訳(メタデータ) (2024-07-15T21:32:58Z) - Learning telic-controllable state representations [3.4530027457862]
有界エージェントにおける状態表現学習のための計算フレームワークを提案する。
本稿では, テリック状態表現の粒度と, 全てのテリック状態に到達するために必要な政策複雑性とのトレードオフを特徴付ける, テリック制御可能性の概念を紹介する。
当社のフレームワークでは,目標の柔軟性と認知的複雑性のバランスをとる状態表現の学習において,意図的な無知(無視すべきことを知る)の役割を強調しています。
論文 参考訳(メタデータ) (2024-06-20T16:38:25Z) - A Unifying Framework for Action-Conditional Self-Predictive Reinforcement Learning [48.59516337905877]
優れた表現を学ぶことは、強化学習(RL)エージェントにとって重要な課題である。
近年の研究では、これらのアルゴリズムに関する理論的洞察が生まれている。
我々は,行動条件の自己予測的目的を分析することによって,理論と実践のギャップを埋める一歩を踏み出した。
論文 参考訳(メタデータ) (2024-06-04T07:22:12Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Intrinsic Physical Concepts Discovery with Object-Centric Predictive
Models [86.25460882547581]
PHYsical Concepts Inference NEtwork (PHYCINE) は、異なる抽象レベルの物理概念を監督なしで推論するシステムである。
物理概念変数を含むオブジェクト表現は因果推論タスクの性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:52:21Z) - Translational Concept Embedding for Generalized Compositional Zero-shot
Learning [73.60639796305415]
一般合成ゼロショット学習は、ゼロショット方式で属性オブジェクト対の合成概念を学習する手段である。
本稿では,これら2つの課題を統一的なフレームワークで解決するために,翻訳概念の埋め込み(translational concept embedded)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-12-20T21:27:51Z) - Active Inference in Robotics and Artificial Agents: Survey and
Challenges [51.29077770446286]
我々は、状態推定、制御、計画、学習のためのアクティブ推論の最先端理論と実装についてレビューする。
本稿では、適応性、一般化性、堅牢性の観点から、その可能性を示す関連する実験を紹介する。
論文 参考訳(メタデータ) (2021-12-03T12:10:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。