論文の概要: Embodied World Models Emerge from Navigational Task in Open-Ended Environments
- arxiv url: http://arxiv.org/abs/2504.11419v1
- Date: Tue, 15 Apr 2025 17:35:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:12:15.786988
- Title: Embodied World Models Emerge from Navigational Task in Open-Ended Environments
- Title(参考訳): オープンエンド環境におけるナビゲーションタスクから生ずる身体的世界モデル
- Authors: Li Jin, Liu Jia,
- Abstract要約: 本研究では、ニューラルネットワークが相互作用によって空間概念を自律的に内部化できるかどうかを検討する。
エージェントは,方向,距離,障害物回避などの空間特性を符号化することができることを示す。
- 参考スコア(独自算出の注目度): 5.785697934050656
- License:
- Abstract: Understanding how artificial systems can develop spatial awareness and reasoning has long been a challenge in AI research. Traditional models often rely on passive observation, but embodied cognition theory suggests that deeper understanding emerges from active interaction with the environment. This study investigates whether neural networks can autonomously internalize spatial concepts through interaction, focusing on planar navigation tasks. Using Gated Recurrent Units (GRUs) combined with Meta-Reinforcement Learning (Meta-RL), we show that agents can learn to encode spatial properties like direction, distance, and obstacle avoidance. We introduce Hybrid Dynamical Systems (HDS) to model the agent-environment interaction as a closed dynamical system, revealing stable limit cycles that correspond to optimal navigation strategies. Ridge Representation allows us to map navigation paths into a fixed-dimensional behavioral space, enabling comparison with neural states. Canonical Correlation Analysis (CCA) confirms strong alignment between these representations, suggesting that the agent's neural states actively encode spatial knowledge. Intervention experiments further show that specific neural dimensions are causally linked to navigation performance. This work provides an approach to bridging the gap between action and perception in AI, offering new insights into building adaptive, interpretable models that can generalize across complex environments. The causal validation of neural representations also opens new avenues for understanding and controlling the internal mechanisms of AI systems, pushing the boundaries of how machines learn and reason in dynamic, real-world scenarios.
- Abstract(参考訳): 人工システムが空間認識と推論をどのように発展させるかを理解することは、AI研究における長年の課題である。
伝統的なモデルは受動的観察に頼っていることが多いが、認知理論の具体化は、環境との活発な相互作用から深い理解が生まれることを示唆している。
本研究では、平面ナビゲーションタスクに焦点をあて、相互作用を通じて空間概念を自律的に内部化できるかどうかを検討する。
GRU(Gated Recurrent Units)とMeta-RL(Meta-RL)を組み合わせることで,エージェントは方向,距離,障害物回避といった空間特性を符号化することができることを示す。
エージェント-環境相互作用を閉力学系としてモデル化するためにハイブリッド力学系(HDS)を導入し、最適なナビゲーション戦略に対応する安定した制限サイクルを明らかにする。
リッジ表現は、ナビゲーションパスを固定次元の行動空間にマッピングし、ニューラルステートとの比較を可能にする。
正準相関解析(CCA)はこれらの表現間の強い整合性を確認し、エージェントの神経状態が空間的知識を積極的にエンコードしていることを示唆している。
干渉実験により、特定の神経次元が航法性能に因果関係があることが示される。
この研究は、AIにおける行動と知覚のギャップを埋めるアプローチを提供し、複雑な環境をまたいで一般化可能な適応的で解釈可能なモデルを構築するための、新たな洞察を提供する。
ニューラル表現の因果検証はまた、AIシステムの内部メカニズムを理解し制御するための新たな道を開き、マシンが動的で現実世界のシナリオで学習し、推論する方法の境界を押し進める。
関連論文リスト
- Learning Dynamic Cognitive Map with Autonomous Navigation [8.301959009586861]
生物にインスパイアされた原理に根ざした空間をナビゲートし、マッピングするための新しい計算モデルを導入する。
我々のモデルは、予測されたポーズに対する動的に拡大する認知マップをActive Inferenceフレームワークに組み込んでいる。
我々のモデルは、観測と世界次元に関する事前の知識なしにこれを達成し、複雑な環境をナビゲートする際の頑丈さと有効性を裏付ける。
論文 参考訳(メタデータ) (2024-11-13T08:59:53Z) - Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions [0.0]
ニューラルネットワークが動的環境におけるエージェントの行動を制御するためにどのように進化するかを検討する。
レーン形成や層流のような単純な挙動は、より線形なネットワーク操作によって特徴づけられる。
中程度のノイズ、広い視野、低いエージェント密度といった特定の環境パラメータは、非線形ネットワークの進化を促進する。
論文 参考訳(メタデータ) (2024-10-25T17:43:00Z) - Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
本研究では,アクティブ推論における動的計画の話題に焦点を当てた。
論文 参考訳(メタデータ) (2024-02-18T17:32:53Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Inferring Relational Potentials in Interacting Systems [56.498417950856904]
このような相互作用を発見する代替手法として、ニューラル・インタラクション・推論(NIIP)を提案する。
NIIPは観測された関係制約を尊重する軌道のサブセットに低エネルギーを割り当てる。
別々に訓練されたモデル間での相互作用の型を交換するなどの軌道操作や、軌道予測を可能にする。
論文 参考訳(メタデータ) (2023-10-23T00:44:17Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Inference of Affordances and Active Motor Control in Simulated Agents [0.5161531917413706]
本稿では,出力確率,時間的予測,モジュール型人工ニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、割当マップと解釈できる潜在状態が発達していることを示す。
アクティブな推論と組み合わせることで、フレキシブルでゴール指向の動作が実行可能であることを示す。
論文 参考訳(メタデータ) (2022-02-23T14:13:04Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。