論文の概要: FluidWorld: Reaction-Diffusion Dynamics as a Predictive Substrate for World Models
- arxiv url: http://arxiv.org/abs/2603.21315v1
- Date: Sun, 22 Mar 2026 16:49:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.349315
- Title: FluidWorld: Reaction-Diffusion Dynamics as a Predictive Substrate for World Models
- Title(参考訳): FluidWorld: 世界モデルのための予測基板としての反応拡散ダイナミクス
- Authors: Fabien Polly,
- Abstract要約: 現在のアプローチでは、学習された潜在空間で動作するTransformerベースの予測器がデフォルトになっている。
本稿では,予測的世界モデリングに自己注意が必要なのか,それとも代替の計算基板が同等あるいは優れた結果が得られるのか,という根本的な疑問を提起する。
反応拡散型の偏微分方程式(PDE)によって予測力学が支配される概念実証世界モデルであるFluidWorldを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: World models learn to predict future states of an environment, enabling planning and mental simulation. Current approaches default to Transformer-based predictors operating in learned latent spaces. This comes at a cost: O(N^2) computation and no explicit spatial inductive bias. This paper asks a foundational question: is self-attention necessary for predictive world modeling, or can alternative computational substrates achieve comparable or superior results? I introduce FluidWorld, a proof-of-concept world model whose predictive dynamics are governed by partial differential equations (PDEs) of reaction-diffusion type. Instead of using a separate neural network predictor, the PDE integration itself produces the future state prediction. In a strictly parameter-matched three-way ablation on unconditional UCF-101 video prediction (64x64, ~800K parameters, identical encoder, decoder, losses, and data), FluidWorld is compared against both a Transformer baseline (self-attention) and a ConvLSTM baseline (convolutional recurrence). While all three models converge to comparable single-step prediction loss, FluidWorld achieves 2x lower reconstruction error, produces representations with 10-15% higher spatial structure preservation and 18-25% more effective dimensionality, and critically maintains coherent multi-step rollouts where both baselines degrade rapidly. All experiments were conducted on a single consumer-grade PC (Intel Core i5, NVIDIA RTX 4070 Ti), without any large-scale compute. These results establish that PDE-based dynamics, which natively provide O(N) spatial complexity, adaptive computation, and global spatial coherence through diffusion, are a viable and parameter-efficient alternative to both attention and convolutional recurrence for world modeling.
- Abstract(参考訳): 世界モデルは、将来の環境状態を予測することを学び、計画とメンタルシミュレーションを可能にします。
現在のアプローチでは、学習された潜在空間で動作するTransformerベースの予測器がデフォルトになっている。
O(N^2) 計算と明示的な空間帰納バイアスがない。
本稿では,予測的世界モデリングに自己注意が必要なのか,それとも代替の計算基板が同等あるいは優れた結果が得られるのか,という根本的な疑問を提起する。
反応拡散型の偏微分方程式(PDE)によって予測力学が支配される概念実証世界モデルであるFluidWorldを紹介する。
別個のニューラルネットワーク予測器を使用する代わりに、PDE統合自体が将来の状態予測を生成する。
UCF-101ビデオ予測(64x64、800Kパラメータ、同一エンコーダ、デコーダ、損失、データ)の厳密なパラメータマッチングによる3方向のアブレーションでは、FluidWorldはTransformerベースライン(自己注意)とConvLSTMベースライン(畳み込み再帰)の両方と比較される。
3つのモデル全てが同等の単一ステップ予測損失に収束する一方で、FluidWorldは2倍の低い再構成誤差を達成し、10-15%の空間構造保存と18-25%の有効次元を持つ表現を生成し、両ベースラインが急速に劣化するコヒーレントなマルチステップロールアウトを批判的に維持する。
すべての実験は1台のコンシューマグレードのPC(Intel Core i5、NVIDIA RTX 4070 Ti)で、大規模な計算は行わなかった。
これらの結果は、O(N)空間複雑性、適応計算、拡散による大域空間コヒーレンスをネイティブに提供するPDEに基づく力学が、世界モデリングにおける注目と畳み込みの両面に対して有効かつパラメータ効率の良い代替手段であることを示す。
関連論文リスト
- LeWorldModel: Stable End-to-End Joint-Embedding Predictive Architecture from Pixels [49.35636088613484]
JEPA(Joint Embedding Predictive Architectures)は、コンパクトな潜在空間で世界モデルを学習するための魅力的なフレームワークを提供する。
最初のJEPAであるLeModelWorldを紹介します。
数時間で1つのGPU上で15万のパラメータをトレーニングできるため、LeWMはファンデーションモデルベースの世界モデルよりも48倍高速に計画している。
論文 参考訳(メタデータ) (2026-03-13T19:48:14Z) - VFMF: World Modeling by Forecasting Vision Foundation Model Features [67.09340259579761]
本稿では,視覚基礎モデルの特徴空間における自己回帰フローマッチングを行う生成予測器を提案する。
この潜伏情報の方がPCAベースの代替案よりも効果的であることを示す。
一致したアーキテクチャと計算により、本手法はすべてのモダリティにおける回帰よりもシャープで正確な予測を生成する。
論文 参考訳(メタデータ) (2025-12-12T02:10:05Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - MORPH: Shape-agnostic PDE Foundation Models [37.26306668589026]
MORPHは偏微分方程式(PDE)の形状に依存しない自己回帰基底モデルである
様々なデータ次元(1D--3D)の不均一な評価をシームレスに処理する畳み込み視覚バックボーン上に構築されている。
広範なデータセット全体にわたって、MORPHは強力なベースラインと最近の最先端モデルにマッチするか、超えている。
論文 参考訳(メタデータ) (2025-09-25T22:38:36Z) - Scientific Machine Learning of Flow Resistance Using Universal Shallow Water Equations with Differentiable Programming [5.061700088495018]
我々はハイブリッド流体力学モデリングのための普遍的なSWE解法であるHydrogradを開発した。
正確に前方シミュレーションを行い、自動微分をサポートし、物理発見のための科学的機械学習を実行することができる。
論文 参考訳(メタデータ) (2025-02-18T00:07:14Z) - BCAT: A Block Causal Transformer for PDE Foundation Models for Fluid Dynamics [4.027470328330335]
BCATは2次元流体力学問題に対する解の自動回帰予測のための基礎モデルである。
我々のアプローチはブロック因果アーキテクチャを用いて次のフレーム予測をモデル化し、画像生成法で一般的に使用されるサブフレームやピクセルベースの入力のみに頼るのではなく、以前のフレームをコンテキスト優先として活用する。
論文 参考訳(メタデータ) (2025-01-31T09:07:56Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - MAgNet: Mesh Agnostic Neural PDE Solver [68.8204255655161]
気候予測は、流体シミュレーションにおける全ての乱流スケールを解決するために、微細な時間分解能を必要とする。
現在の数値モデル解法 PDEs on grids that too coarse (3km~200km on each side)
本研究では,空間的位置問合せが与えられたPDEの空間的連続解を予測する新しいアーキテクチャを設計する。
論文 参考訳(メタデータ) (2022-10-11T14:52:20Z) - Emulating Spatio-Temporal Realizations of Three-Dimensional Isotropic
Turbulence via Deep Sequence Learning Models [24.025975236316842]
最先端のディープラーニング技術を用いて3次元乱流をモデル化するために,データ駆動方式を用いる。
モデルの精度は、統計および物理に基づくメトリクスを用いて評価される。
論文 参考訳(メタデータ) (2021-12-07T03:33:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。