論文の概要: Flow Equivariant World Models: Memory for Partially Observed Dynamic Environments
- arxiv url: http://arxiv.org/abs/2601.01075v1
- Date: Sat, 03 Jan 2026 05:22:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.999252
- Title: Flow Equivariant World Models: Memory for Partially Observed Dynamic Environments
- Title(参考訳): フロー同変世界モデル:部分的に観察された動的環境の記憶
- Authors: Hansen Jin Lillemark, Benhao Huang, Fangneng Zhan, Yilun Du, Thomas Anderson Keller,
- Abstract要約: 身体系は「流れのシンフォニー」として世界を経験する
ほとんどのニューラルネットワークの世界モデルは、この構造を無視し、データから同じ変換を繰り返し再学習します。
自己運動と外部物体の動きを1パラメータのリー群「フロー」として統一するフレームワーク「フロー同変世界モデル」を紹介する。
- 参考スコア(独自算出の注目度): 54.23746358078753
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied systems experience the world as 'a symphony of flows': a combination of many continuous streams of sensory input coupled to self-motion, interwoven with the dynamics of external objects. These streams obey smooth, time-parameterized symmetries, which combine through a precisely structured algebra; yet most neural network world models ignore this structure and instead repeatedly re-learn the same transformations from data. In this work, we introduce 'Flow Equivariant World Models', a framework in which both self-motion and external object motion are unified as one-parameter Lie group 'flows'. We leverage this unification to implement group equivariance with respect to these transformations, thereby providing a stable latent world representation over hundreds of timesteps. On both 2D and 3D partially observed video world modeling benchmarks, we demonstrate that Flow Equivariant World Models significantly outperform comparable state-of-the-art diffusion-based and memory-augmented world modeling architectures -- particularly when there are predictable world dynamics outside the agent's current field of view. We show that flow equivariance is particularly beneficial for long rollouts, generalizing far beyond the training horizon. By structuring world model representations with respect to internal and external motion, flow equivariance charts a scalable route to data efficient, symmetry-guided, embodied intelligence. Project link: https://flowequivariantworldmodels.github.io.
- Abstract(参考訳): 身体的なシステムは「流れのシンフォニー」として世界を経験し、知覚入力の連続的な流れと、外部の物体の力学と相互作用する自己運動が組み合わさった。
これらのストリームは、正確に構造化された代数を通して結合するスムーズな時間パラメータ化された対称性に従うが、ほとんどのニューラルネットワーク世界モデルは、この構造を無視し、データから同じ変換を繰り返し再学習する。
本研究では、自己運動と外部物体の動きの両方を1パラメータリー群「フロー」として統一するフレームワーク「フロー同変世界モデル」を紹介する。
この統一を利用して、これらの変換に対する群同値を実装し、数百の時間ステップにわたって安定な潜在世界表現を提供する。
2Dと3Dの両方で部分的に観察されたビデオワールドモデリングベンチマークでは、Flow Equivariant World Modelsが、特にエージェントの現在の視野外で予測可能な世界ダイナミクスが存在する場合、最先端の拡散ベースおよびメモリ拡張された世界モデリングアーキテクチャよりも大幅に優れていることを実証しています。
流れの均等性は長期のロールアウトには特に有用であり、トレーニングの地平線を超えて一般化されている。
内部および外部運動に関する世界モデル表現を構造化することにより、フロー均等チャートは、データ効率、対称性誘導、具体的インテリジェンスへのスケーラブルなルートを提供する。
プロジェクトリンク:https://flowequivariantworldmodels.github.io
関連論文リスト
- FlowNet: Modeling Dynamic Spatio-Temporal Systems via Flow Propagation [43.89691389856747]
複雑な動的時間系の正確なモデリングには、フロー媒介の相互依存性と文脈に敏感な相互作用のダイナミクスを捉える必要がある。
既存の方法は、主にグラフベースまたは注目駆動であり、システムの進化を管理する非対称なフロー交換である類似性駆動の接続仮定に依存している。
本研究では,物理に着想を得たパラダイムである時空間流を提案する。
実験によると、FlowNetは3つの現実世界のシステムのモデリングにおいて、既存の7つのメトリクスに対する最先端のアプローチを著しく上回り、その効率性と物理的解釈可能性を検証する。
論文 参考訳(メタデータ) (2025-11-05T14:06:19Z) - On the flow matching interpretability [2.816392009888047]
本稿では,既知の物理分布から各フローステップを抽出するフレームワークを提案する。
流れの軌跡は、シミュレートされた物理過程の平衡状態にマッピングされる(そしてトラバースに制約される)。
このことは、生成フローに物理的意味論を埋め込むことで、神経軌跡を解釈可能な物理過程に変換することを示している。
論文 参考訳(メタデータ) (2025-10-24T07:26:45Z) - Kuramoto Orientation Diffusion Models [67.0711709825854]
指紋やテクスチャなどのオリエンテーションに富んだ画像は、しばしばコヒーレントな角模様を示す。
生体系における位相同期の役割を動機として,スコアベース生成モデルを提案する。
一般的な画像ベンチマークで競合する結果を実装し,指紋やテクスチャなどの指向性データセットの生成品質を大幅に向上する。
論文 参考訳(メタデータ) (2025-09-18T18:18:49Z) - Flow Equivariant Recurrent Neural Networks [2.900810893770134]
機械学習では、データの対称性を尊重するニューラルネットワークアーキテクチャを同変と呼ぶ。
我々は同変ネットワーク理論をこの流れの体系に拡張し、時間とともに自然変換を捉える。
これらのモデルは、トレーニング速度、長さの一般化、速度の一般化において、非同変モデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2025-07-20T02:52:21Z) - Revisiting Multi-Agent World Modeling from a Diffusion-Inspired Perspective [54.77404771454794]
拡散モデルを用いたマルチエージェント強化学習(MARL)のためのフレキシブルで堅牢な世界モデルを開発する。
本手法はDiffusion-Inspired Multi-Agent World Model (DIMA) を用いて,複数のマルチエージェント制御ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2025-05-27T09:11:38Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - EvoFed: Leveraging Evolutionary Strategies for Communication-Efficient
Federated Learning [15.124439914522693]
Federated Learning(FL)は分散ノード間の協調モデルトレーニングを可能にする分散機械学習パラダイムである。
本稿では,進化戦略(ES)をFLと統合し,これらの課題に対処する新しいアプローチであるEvoFedを提案する。
論文 参考訳(メタデータ) (2023-11-13T17:25:06Z) - Pre-training Contextualized World Models with In-the-wild Videos for
Reinforcement Learning [54.67880602409801]
本稿では,視覚制御タスクの学習を効率的に行うために,Wild 動画を多用した事前学習型世界モデルの課題について検討する。
本稿では、コンテキストと動的モデリングを明確に分離したContextualized World Models(ContextWM)を紹介する。
実験により,ContextWMを内蔵したWildビデオ事前学習は,モデルベース強化学習のサンプル効率を大幅に向上できることが示された。
論文 参考訳(メタデータ) (2023-05-29T14:29:12Z) - Learning Robust Dynamics through Variational Sparse Gating [18.476155786474358]
多くのオブジェクトを持つ環境では、少数のオブジェクトが同時に動いたり相互作用したりしているのが普通です。
本稿では,このスパース相互作用の帰納バイアスを,画素から学習した世界モデルの潜在ダイナミクスに統合する。
論文 参考訳(メタデータ) (2022-10-21T02:56:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。