論文の概要: General Agents Contain World Models, even under Partial Observability and Stochasticity
- arxiv url: http://arxiv.org/abs/2602.03146v1
- Date: Tue, 03 Feb 2026 06:00:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.276048
- Title: General Agents Contain World Models, even under Partial Observability and Stochasticity
- Title(参考訳): 部分観測可能性と確率性の下でも世界モデルを含む一般エージェント
- Authors: Santiago Cifuentes,
- Abstract要約: エージェントはランダム化を用いて環境を学習することができないことを示す。
我々は一般性の概念を弱め、力の弱いエージェントが既に彼らが運用する世界のモデルを含んでいることを証明した。
- 参考スコア(独自算出の注目度): 0.913755431537592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deciding whether an agent possesses a model of its surrounding world is a fundamental step toward understanding its capabilities and limitations. In [10], it was shown that, within a particular framework, every almost optimal and general agent necessarily contains sufficient knowledge of its environment to allow an approximate reconstruction of it by querying the agent as a black box. This result relied on the assumptions that the agent is deterministic and that the environment is fully observable. In this work, we remove both assumptions by extending the theorem to stochastic agents operating in partially observable environments. Fundamentally, this shows that stochastic agents cannot avoid learning their environment through the usage of randomization. We also strengthen the result by weakening the notion of generality, proving that less powerful agents already contain a model of the world in which they operate.
- Abstract(参考訳): エージェントが周囲の世界のモデルを持っているかどうかを決定することは、その能力と限界を理解するための基本的なステップである。
10]では,特定のフレームワーク内では,エージェントをブラックボックスとしてクエリすることで,エージェントを近似的な再構築を可能にするため,ほぼ最適で汎用的なエージェントに,その環境に関する十分な知識が必然的に含まれていることが示されている。
この結果は、エージェントが決定論的であり、環境が完全に観察可能であるという仮定に依存する。
本研究では、この定理を部分的に観測可能な環境で動作している確率的エージェントに拡張することで、両方の仮定を除去する。
基本的に、確率的エージェントはランダム化を用いることで環境の学習を避けることはできない。
我々はまた、一般性の概念を弱め、力の弱いエージェントが既に運用されている世界のモデルを含んでいることを証明し、その結果を強化する。
関連論文リスト
- What Do LLM Agents Know About Their World? Task2Quiz: A Paradigm for Studying Environment Understanding [50.35012849818872]
大規模言語モデル(LLM)エージェントは、複雑な意思決定やツール使用タスクにおいて顕著な能力を示した。
本研究では,タスク実行と世界状態理解の分離を目的とした決定論的かつ自動評価パラダイムであるTask-to-Quiz(T2Q)を提案する。
実験の結果,タスク成功は環境理解の指標として不十分な場合が多く,現在の記憶機構はエージェントが環境の基底モデルを取得するのに有効ではないことが明らかとなった。
論文 参考訳(メタデータ) (2026-01-14T14:09:11Z) - Current Agents Fail to Leverage World Model as Tool for Foresight [61.82522354207919]
エージェントは、行動する前に結果を予測するためにそれらを使用できます。
本稿では,現在のエージェントがそのような世界モデルを,認知力を高めるツールとして活用できるかどうかを実証的に検討する。
論文 参考訳(メタデータ) (2026-01-07T13:15:23Z) - Embedded Universal Predictive Intelligence: a coherent framework for multi-agent learning [57.23345786304694]
予測学習のための枠組みと自己予測を中心とした組込みエージェントを導入する。
マルチエージェント設定では、エージェントが類似したアルゴリズムを実行している他のエージェントについて推論することができる。
我々は、AIXIの理論を拡張し、Solomonoffから始まる普遍的なインテリジェントな埋め込みエージェントについて研究する。
論文 参考訳(メタデータ) (2025-11-27T08:46:48Z) - Wisdom of Crowds Through Myopic Self-Confidence Adaptation [1.1060425537315088]
群衆の知恵は、集団の集団的判断や決定が集団メンバーの個人的判断や決定よりも正確であることを示す現象の包括的用語である。
本稿では,まず,世界の共通状態を非相関的かつ非バイアス的に測定するエージェントのグループについて考察する。
これらのエージェントは、フレンチ・デグルート力学(英語版)または反復的な意見プール(英語版)として社会学でよく知られる単純な非ベイズ学習規則に従って、見積もりを反復的に更新する。
論文 参考訳(メタデータ) (2025-06-22T22:55:17Z) - Disentangling Representations through Multi-task Learning [0.0]
分類タスクを最適に解決するエージェントにおいて,不整合表現の出現を保証する実験および理論的結果を提供する。
マルチタスクに訓練されたRNNにおいて、これらの予測を実験的に検証し、連続的な誘引子の形で非絡み合った表現を学習する。
私たちは、トランスフォーマーが特に、そのユニークな世界理解能力を説明するような、無関係な表現に向いていることに気付きました。
論文 参考訳(メタデータ) (2024-07-15T21:32:58Z) - A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。
我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文 参考訳(メタデータ) (2020-11-20T22:17:12Z) - Empirically Verifying Hypotheses Using Reinforcement Learning [58.09414653169534]
本稿では,仮説検証をRL問題として定式化する。
我々は、世界の力学に関する仮説を前提として、仮説が真か偽かを予測するのに役立つ観測結果を生成することができるエージェントを構築することを目指している。
論文 参考訳(メタデータ) (2020-06-29T01:01:10Z) - Maximizing Information Gain in Partially Observable Environments via
Prediction Reward [64.24528565312463]
本稿では,深いRLエージェントに対する信念に基づく報酬の活用という課題に取り組む。
負のエントロピーと予測される予測報酬の正確な誤差を導出する。
この洞察は、予測報酬を用いたいくつかの分野の理論的動機を与える。
論文 参考訳(メタデータ) (2020-05-11T08:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。