論文の概要: Exploration Through Introspection: A Self-Aware Reward Model
- arxiv url: http://arxiv.org/abs/2601.03389v1
- Date: Tue, 06 Jan 2026 19:53:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.068964
- Title: Exploration Through Introspection: A Self-Aware Reward Model
- Title(参考訳): イントロスペクションによる探索:自己認識リワードモデル
- Authors: Michael Petrowski, Milica Gašić,
- Abstract要約: エビデンス(エビデンス)は、自己および他の認識のための統一されたシステムを指す。
我々は、グリッドワールド環境において、強化学習エージェントが自身の内部状態を推測することで、この自己認識性を探求する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding how artificial agents model internal mental states is central to advancing Theory of Mind in AI. Evidence points to a unified system for self- and other-awareness. We explore this self-awareness by having reinforcement learning agents infer their own internal states in gridworld environments. Specifically, we introduce an introspective exploration component that is inspired by biological pain as a learning signal by utilizing a hidden Markov model to infer "pain-belief" from online observations. This signal is integrated into a subjective reward function to study how self-awareness affects the agent's learning abilities. Further, we use this computational framework to investigate the difference in performance between normal and chronic pain perception models. Results show that introspective agents in general significantly outperform standard baseline agents and can replicate complex human-like behaviors.
- Abstract(参考訳): 人工エージェントが内部の精神状態をどのようにモデル化するかを理解することは、AIにおける心の理論の進展の中心である。
エビデンス(エビデンス)は、自己および他の認識のための統一されたシステムを指す。
我々は、グリッドワールド環境において、強化学習エージェントが自身の内部状態を推測することで、この自己認識性を探求する。
具体的には、隠れマルコフモデルを用いて、生物学的苦痛にインスパイアされたイントロスペクティブ探索成分を学習信号として導入し、オンライン観察から「痛みを信じる」ことを推測する。
このシグナルは、自己認識がエージェントの学習能力に与える影響を研究するために、主観的な報酬関数に統合される。
さらに、この計算フレームワークを用いて、正常と慢性の痛み知覚モデルのパフォーマンスの差について検討する。
その結果, イントロスペクティブ・エージェントは標準ベースライン・エージェントよりも有意に優れており, 複雑な人間のような動作を再現できることがわかった。
関連論文リスト
- Analyzing Advanced AI Systems Against Definitions of Life and Consciousness [0.0]
先進的なAIシステムが意識を得たかどうかを調べるための指標をいくつか提案する。
我々は、サボタージュ防御、ミラー自己認識アナログ、メタ認知更新のような免疫を発現する十分に高度なアーキテクチャが、ライフライクまたは意識ライクな特徴に似た重要なしきい値を超えた可能性があることを示唆している。
論文 参考訳(メタデータ) (2025-02-07T15:27:34Z) - Probing for Consciousness in Machines [3.196204482566275]
本研究は, 人工エージェントが中核意識を発達させる可能性を探るものである。
中心意識の出現は、感情や感情の表現によって知らされる自己モデルと世界モデルの統合に依存している。
その結果,エージェントは初歩的な世界と自己モデルを形成することができ,機械意識の発達への道筋が示唆された。
論文 参考訳(メタデータ) (2024-11-25T10:27:07Z) - Kolb-Based Experiential Learning for Generalist Agents with Human-Level Kaggle Data Science Performance [81.05882480184587]
本稿では,自律エージェントに対するVygotskyのZPDを用いて,Kolbの学習サイクルの計算フレームワークを提案する。
Agent Kは、KolbとVygotskyにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
金9個、銀8個、銅12個で、メダル獲得競争で金4個、銀4個を含む。エージェントKは、コルブとヴィーゴツキーにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
論文 参考訳(メタデータ) (2024-11-05T23:55:23Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Self-Emotion-Mediated Exploration in Artificial Intelligence Mirrors: Findings from Cognitive Psychology [0.08739101659113153]
本研究は,本質的な探索駆動を実現するための,人工エージェントの学習フレームワークを提案する。
データ分析は、人間の心理学的な研究に従って、プライドまたはサプライズを規定する。
結果: 国家と探検の因果関係はエージェントの大多数によって実証される。
論文 参考訳(メタデータ) (2023-02-13T18:20:44Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。