論文の概要: Building spatial world models from sparse transitional episodic memories
- arxiv url: http://arxiv.org/abs/2505.13696v1
- Date: Mon, 19 May 2025 19:56:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.507245
- Title: Building spatial world models from sparse transitional episodic memories
- Title(参考訳): スパース・トランジッショナル・エピソード記憶を用いた空間世界モデルの構築
- Authors: Zizhan He, Maxime Daigle, Pouya Bashivan,
- Abstract要約: ニューラルネットワークは,スパースや不連続なエピソード記憶から周囲の空間モデルを構築することができることを示す。
本研究では,Epsodic Space World Model (ESWM) はサンプル効率が高く,環境のロバストな表現を構築するためには最小限の観測が必要であることを示す。
- 参考スコア(独自算出の注目度): 1.3459777108901956
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Many animals possess a remarkable capacity to rapidly construct flexible mental models of their environments. These world models are crucial for ethologically relevant behaviors such as navigation, exploration, and planning. The ability to form episodic memories and make inferences based on these sparse experiences is believed to underpin the efficiency and adaptability of these models in the brain. Here, we ask: Can a neural network learn to construct a spatial model of its surroundings from sparse and disjoint episodic memories? We formulate the problem in a simulated world and propose a novel framework, the Episodic Spatial World Model (ESWM), as a potential answer. We show that ESWM is highly sample-efficient, requiring minimal observations to construct a robust representation of the environment. It is also inherently adaptive, allowing for rapid updates when the environment changes. In addition, we demonstrate that ESWM readily enables near-optimal strategies for exploring novel environments and navigating between arbitrary points, all without the need for additional training.
- Abstract(参考訳): 多くの動物は環境の柔軟な精神モデルを構築するのに顕著な能力を持っている。
これらの世界モデルは、航海、探検、計画といった倫理的な行動に不可欠である。
エピソード記憶を形成し、これらのスパース体験に基づいて推論を行う能力は、脳内のこれらのモデルの効率性と適応性を支えていると考えられている。
ニューラルネットワークは、スパースと不整合のエピソード記憶から周囲の空間モデルを構築することができるのか?
シミュレーションの世界における問題を定式化し,新たな枠組みであるエピソード空間世界モデル(ESWM)を提案する。
本研究では,ESWMは試料効率が高く,環境のロバストな表現を構築するためには最小限の観測が必要であることを示す。
また、自然に適応しており、環境が変わると素早く更新できる。
さらに,新たな環境を探索し,任意の地点をナビゲートするための準最適戦略を,追加の訓練を必要とせずに容易に実現できることを実証した。
関連論文リスト
- Learning Local Causal World Models with State Space Models and Attention [1.5498250598583487]
本研究では,SSMが単純な環境のダイナミクスをモデル化し,因果モデルを同時に学習できることを示す。
我々は、SSMの強みに傾倒するさらなる実験の道を開き、因果意識でそれらをさらに強化する。
論文 参考訳(メタデータ) (2025-05-04T11:57:02Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - AdaWorld: Learning Adaptable World Models with Latent Actions [76.50869178593733]
我々は,効率的な適応を実現する革新的な世界モデル学習手法であるAdaWorldを提案する。
主要なアイデアは、世界モデルの事前トレーニング中にアクション情報を統合することである。
次に、これらの潜伏行動を条件とした自己回帰的世界モデルを開発する。
論文 参考訳(メタデータ) (2025-03-24T17:58:15Z) - Multimodal Dreaming: A Global Workspace Approach to World Model-Based Reinforcement Learning [2.5749046466046903]
強化学習(Reinforcement Learning, RL)では、世界モデルはエージェントの行動に応じて環境がどのように進化するかを捉えることを目的としている。
潜在空間内での夢のプロセスの実行は、より少ない環境ステップでのトレーニングを可能にすることを示す。
我々は、GWとWorld Modelsの組み合わせは、RLエージェントの意思決定を改善する大きな可能性を秘めていると結論づける。
論文 参考訳(メタデータ) (2025-02-28T15:24:17Z) - Learning Dynamic Cognitive Map with Autonomous Navigation [8.301959009586861]
生物にインスパイアされた原理に根ざした空間をナビゲートし、マッピングするための新しい計算モデルを導入する。
我々のモデルは、予測されたポーズに対する動的に拡大する認知マップをActive Inferenceフレームワークに組み込んでいる。
我々のモデルは、観測と世界次元に関する事前の知識なしにこれを達成し、複雑な環境をナビゲートする際の頑丈さと有効性を裏付ける。
論文 参考訳(メタデータ) (2024-11-13T08:59:53Z) - A Biologically-Inspired Dual Stream World Model [0.456877715768796]
中間側頭葉(MTL)は哺乳類の体験構築システムであると考えられている。
本稿では,高次元観測から学習し,それらを文脈やコンテンツストリームに分解する新たなモデルであるDual Stream World Model (DSWM)を提案する。
この表現は強化学習基盤関数として有用であり,ダイナ様更新を用いた政策学習を支援するために生成モデルが有用であることを示す。
論文 参考訳(メタデータ) (2022-09-16T16:27:48Z) - OPEn: An Open-ended Physics Environment for Learning Without a Task [132.6062618135179]
オープンエンドな物理環境で学んだ世界のモデルが、特定のタスクを伴わずに、下流の物理推論タスクに再利用できるかどうかについて検討する。
我々は,OPEn(Open-ended Physics ENvironment)のベンチマークを構築し,この環境における学習表現をテストするためのいくつかのタスクを明示的に設計する。
その結果、教師なしのコントラスト学習を表現学習に用いたエージェントと、探索のためのインパクト駆動学習が最良の結果となった。
論文 参考訳(メタデータ) (2021-10-13T17:48:23Z) - Mutual Information Maximization for Robust Plannable Representations [82.83676853746742]
モデルに基づく強化学習のための情報理論表現学習アルゴリズムMIROを提案する。
提案手法は, 邪魔や散らかったシーンの存在下で, 再建目的よりも頑健であることを示す。
論文 参考訳(メタデータ) (2020-05-16T21:58:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。