論文の概要: Neural Fields as World Models
- arxiv url: http://arxiv.org/abs/2602.18690v1
- Date: Sat, 21 Feb 2026 01:52:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.23865
- Title: Neural Fields as World Models
- Title(参考訳): 世界モデルとしてのニューラルフィールド
- Authors: Joshua Nunley,
- Abstract要約: 機械学習の世界モデルは視覚入力を潜在空間に圧縮し、知覚皮質を特徴付ける空間構造を捨てる。
我々は、物理予測が抽象状態遷移ではなく幾何学的伝播となるよう、感覚トポロジーを保存するアーキテクチャーを提案する。
3つの実験がこのアプローチを支持している:(1)局所接続は弾道物理学を学ぶのに十分であり、(2)テイルポーティングよりも中間位置を横断する予測、(2)遅延空間のオルタナティブの約2倍の速度で実物理への想像的移動で完全に訓練されたポリシー、(3)運動制御チャネルは、ビジュモータ予測だけで自然に身体選択的エンコーディングを発達させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How does the brain predict physical outcomes while acting in the world? Machine learning world models compress visual input into latent spaces, discarding the spatial structure that characterizes sensory cortex. We propose isomorphic world models: architectures preserving sensory topology so that physics prediction becomes geometric propagation rather than abstract state transition. We implement this using neural fields with motor-gated channels, where activity evolves through local lateral connectivity and motor commands multiplicatively modulate specific populations. Three experiments support this approach: (1) local connectivity is sufficient to learn ballistic physics, with predictions traversing intermediate locations rather than "teleporting"; (2) policies trained entirely in imagination transfer to real physics at nearly twice the rate of latent-space alternatives; and (3) motor-gated channels spontaneously develop body-selective encoding through visuomotor prediction alone. These findings suggest intuitive physics and body schema may share a common origin in spatially structured neural dynamics.
- Abstract(参考訳): 脳はどのようにして世界で行動しながら身体的な結果を予測するのか?
機械学習の世界モデルは視覚入力を潜在空間に圧縮し、知覚皮質を特徴付ける空間構造を捨てる。
我々は、物理予測が抽象状態遷移ではなく幾何学的伝播となるよう、感覚トポロジーを保存するアーキテクチャーを提案する。
運動は局所的な側方接続を通じて進化し、運動コマンドは特定の個体群を乗法的に調節する。
3つの実験がこのアプローチを支持している:(1)局所接続は弾道物理学を学ぶのに十分であり、(2)テイルポーティングよりも中間位置を横断する予測、(2)遅延空間のオルタナティブの約2倍の速度で実物理への想像的移動で完全に訓練されたポリシー、(3)運動制御チャネルは、ビジュモータ予測だけで自然に身体選択的エンコーディングを発達させる。
これらの結果は、直感的な物理と身体スキーマは、空間的に構造化された神経力学において共通の起源を持つ可能性があることを示唆している。
関連論文リスト
- Human-level 3D shape perception emerges from multi-view learning [63.048728487674815]
任意のオブジェクトに対する人間の3次元形状推論を予測するためのモデリングフレームワークを開発する。
我々は、自然主義的な知覚データよりも視覚空間的目的を用いて訓練された新しいニューラルネットワークのクラスでこれを達成した。
人間のレベル3D知覚は、自然主義的な視覚空間データよりもシンプルでスケーラブルな学習目標から生まれる可能性がある。
論文 参考訳(メタデータ) (2026-02-19T18:56:05Z) - WoW: Towards a World omniscient World model Through Embodied Interaction [83.43543124512719]
世界モデルの正当性的な物理的直観は、現実世界との広範囲で因果的に豊かな相互作用に基礎を置いていなければならない。
このWoWは、200万のロボットインタラクショントラジェクトリに基づいてトレーニングされた、ジェネレーティブな世界モデルである。
WoWBenchは、ビデオの物理的一貫性と因果推論に焦点を当てた新しいベンチマークである。
論文 参考訳(メタデータ) (2025-09-26T17:59:07Z) - Mind Meets Space: Rethinking Agentic Spatial Intelligence from a Neuroscience-inspired Perspective [53.556348738917166]
エージェントAIの最近の進歩は、自律的なタスク実行と言語に基づく推論が可能なシステムにつながっている。
人間の空間知能は、統合された多感覚知覚、空間記憶、認知マップに根ざし、非構造環境における柔軟でコンテキスト対応の意思決定を可能にする。
論文 参考訳(メタデータ) (2025-09-11T05:23:22Z) - Intuitive physics understanding emerges from self-supervised pretraining on natural videos [39.030105916720835]
自然映像におけるマスキング領域の予測を訓練したディープニューラルネットワークモデルにおける直感的な物理理解の出現について検討する。
学習された表現空間における結果を予測するために訓練された映像予測モデルは、様々な直感的な物理特性の理解を示す。
論文 参考訳(メタデータ) (2025-02-17T14:27:14Z) - Traveling Waves Integrate Spatial Information Through Time [3.3496112914071166]
視覚刺激に応答して隠れた状態で進行波を発生させる畳み込みリカレントニューラルネットワークを導入する。
移動波は局所的に接続されたニューロンの受容野を効果的に拡張し、長距離符号化と情報通信を支援する。
人工ネットワークにおける移動波に基づくコミュニケーションと視覚表現への第一歩として,波動力学が効率性とトレーニング安定性の恩恵をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2025-02-09T21:14:27Z) - Towards Physically Interpretable World Models: Meaningful Weakly Supervised Representations for Visual Trajectory Prediction [0.1534667887016089]
本稿では,学習した潜在表現と実世界の物理量とを一致させる新しいアーキテクチャを提案する。
3つのケーススタディは,本手法が物理的解釈可能性および正確な状態予測を実現することを実証している。
論文 参考訳(メタデータ) (2024-12-17T12:51:24Z) - Latent Intuitive Physics: Learning to Transfer Hidden Physics from A 3D Video [58.043569985784806]
本稿では,物理シミュレーションのための伝達学習フレームワークである潜在直観物理学を紹介する。
単一の3Dビデオから流体の隠れた性質を推測し、新しいシーンで観察された流体をシミュレートすることができる。
我々は,本モデルの有効性を3つの方法で検証する: (i) 学習されたビジュアルワールド物理を用いた新しいシーンシミュレーション, (ii) 観測された流体力学の将来予測, (iii) 教師付き粒子シミュレーション。
論文 参考訳(メタデータ) (2024-06-18T16:37:44Z) - Neural Fields in Visual Computing and Beyond [54.950885364735804]
機械学習の最近の進歩は、座標ベースニューラルネットワークを用いた視覚コンピューティング問題の解決への関心が高まっている。
ニューラルネットワークは、3D形状と画像の合成、人体のアニメーション、3D再構成、ポーズ推定に成功している。
本報告は、文脈、数学的基礎、および、ニューラルネットワークに関する文献の広範なレビューを提供する。
論文 参考訳(メタデータ) (2021-11-22T18:57:51Z) - ST-PCNN: Spatio-Temporal Physics-Coupled Neural Networks for Dynamics
Forecasting [15.265694039283106]
本稿では,システムの物理を規定するパラメータを学習する物理結合型ニューラルネットワークモデルを提案する。
3つの目標を達成するために,時空間物理結合ニューラルネットワーク(ST-PCNN)モデルを提案する。
ST-PCNNが既存の物理インフォームドモデルより優れていることを検証する。
論文 参考訳(メタデータ) (2021-08-12T19:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。