論文の概要: BRICKS-WM: Building Reusability via Interface Composition Kinetics for Structured World Models
- arxiv url: http://arxiv.org/abs/2606.16489v1
- Date: Mon, 15 Jun 2026 09:55:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.357505
- Title: BRICKS-WM: Building Reusability via Interface Composition Kinetics for Structured World Models
- Title(参考訳): BRICKS-WM:構造化世界モデルのためのインタフェース構成力学による再利用性の構築
- Authors: Shaowei Zhang, Jiahan Cao, Xunlan Zhou, Shenghua Wan, De-Chuan Zhan,
- Abstract要約: 本稿では,構造化世界モデルのモジュール化のためのフレームワークであるBRICKS-WMを紹介する。
最小限のインスタンス化として、潜伏状態空間をアクティベートされたエージェントモジュールと外部のバックグラウンドモジュールに分解する。
BRICKS-WMは、スクラッチからトレーニングした場合、強力なモノリシックベースラインに匹敵する制御性能を達成する。
- 参考スコア(独自算出の注目度): 44.13098312901522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Model-based Reinforcement Learning (MBRL) has achieved remarkable success in continuous control by leveraging latent world models. However, prevailing approaches typically rely on monolithic latent dynamics, entangling environment dynamics into a coupled process. This coupling severely limits reusability: altering the agent necessitates retraining the entire world from scratch, even if the environment remains constant. To address this, we introduce BRICKS-WM (Building Reusability via Interface Composition Kinetics for Structured World Models), a framework for the modular assembly of structured world models. Driven by the insight that the physical world is composed of independent entities, we posit that global dynamics can be modeled as a composition of distinct dynamical modules interacting via latent interfaces. As a minimal instantiation, we factorize the latent state space into an actuated Agent module and an external Background module, bridged by a learned latent interface. Unlike prior object-centric methods that prioritize visual segmentation, BRICKS-WM enforces a functional separation in transition dynamics, ensuring that background dynamics remains agnostic to the agent's dynamics. Empirically, BRICKS-WM achieves control performance comparable to strong monolithic baselines when trained from scratch, and enables the reuse of frozen background dynamics across agents.
- Abstract(参考訳): モデルベース強化学習(MBRL)は、潜在世界モデルを活用することで、継続的な制御において顕著な成功を収めた。
しかし、一般的なアプローチは、通常、モノリシックな潜伏力学に依存し、環境力学を結合プロセスに統合する。
この結合は再利用可能性を大幅に制限する: 環境が一定であっても、エージェントを変更することは、世界全体をスクラッチから再訓練する必要がある。
そこで本研究では,構造化世界モデルのモジュール化のためのフレームワークであるBRICKS-WM (Building Reusability via Interface Composition Kinetics for Structured World Models)を紹介する。
物理的世界は独立した実体で構成されているという洞察に基づいて、グローバルダイナミクスは潜在インターフェースを介して相互作用する異なる動的モジュールの合成としてモデル化できると仮定する。
最小限のインスタンス化として、潜伏状態空間をアクティベートされたエージェントモジュールと学習された潜伏インターフェースでブリッジされた外部バックグラウンドモジュールに分解する。
視覚的セグメンテーションを優先する従来のオブジェクト中心の手法とは異なり、BRICKS-WMは遷移力学の関数的分離を強制し、背景力学がエージェントのダイナミクスに非依存であることを保証する。
経験的に、BRICKS-WMは、スクラッチからトレーニングされた時に強力なモノリシックベースラインに匹敵する制御性能を達成し、エージェント間の凍結バックグラウンドダイナミクスの再利用を可能にする。
関連論文リスト
- Back to Parsimonious Latents: Learning Task-Centric World Models from Visual Foundations [35.521396983843864]
本稿では,基礎モデル埋め込みをコンパクトでタスクに適した世界表現に変換するためのフレームワークを提案する。
TC-WM は、動的空間としてコンパクトなラテントに高次元の視覚的埋め込みを射影する。
TC-WMは、タスク中心の潜在要因を単純な変換まで特定するのに十分であることを示す。
論文 参考訳(メタデータ) (2026-05-25T09:21:43Z) - Structure Abstraction and Generalization in a Hippocampal-Entorhinal Inspired World Model [11.849694189409526]
脳にインスパイアされた階層モデルが潜伏遷移を推測し、予測的視覚世界モデルを構築する方法を示す。
この研究は、脳にインスパイアされた、世界モデルの自己教師付き学習が再利用可能な抽象的知識の獲得をいかに促進するかを理解するための、新しい計算フレームワークを提供する。
論文 参考訳(メタデータ) (2026-05-15T08:36:40Z) - The Global Neural World Model: Spatially Grounded Discrete Topologies for Action-Conditioned Planning [0.9137554315375919]
我々は、トポロジカル量子化を実現する自己安定化フレームワークであるGNWM(Global Neural World Model)を提案する。
JEPA(Joint-Embedding Predictive Architecture)として活動する
筆者らは, このアーキテクチャにより, 「グリッドスナッピング」 を固有誤差補正機構として利用することにより, 自己回帰ロールアウト時の多様体のドリフトを防止することができることを示した。
論文 参考訳(メタデータ) (2026-04-17T15:12:15Z) - The Trinity of Consistency as a Defining Principle for General World Models [106.16462830681452]
一般世界モデルは、客観的物理法則を学習し、シミュレートし、推論することができる。
本稿では,一般世界モデルに必要な基本的特性を定義するための理論的枠組みを提案する。
我々の研究は、現在のシステムの限界と将来の進歩のためのアーキテクチャ要件の両方を明確にし、一般的な世界モデルへの原則的な経路を確立します。
論文 参考訳(メタデータ) (2026-02-26T16:15:55Z) - Aligning Agentic World Models via Knowledgeable Experience Learning [68.85843641222186]
環境フィードバックをシンセサイザー化したWorld Knowledge Repositoryを構築するフレームワークであるWorldMindを紹介する。
WorldMindは、優れたクロスモデルとクロス環境転送性を備えたベースラインよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-01-19T17:33:31Z) - Prismatic World Model: Learning Compositional Dynamics for Planning in Hybrid Systems [38.4555621948915]
Prismatic World Model (PRISM-WM) は複雑なハイブリッド力学を構成可能なプリミティブに分解するように設計されている。
PRISM-WMは系力学におけるシャープモード遷移を正確にモデル化することでロールアウトドリフトを著しく低減する。
論文 参考訳(メタデータ) (2025-12-09T09:40:34Z) - Natural Building Blocks for Structured World Models: Theory, Evidence, and Scaling [42.78591555984395]
本研究では,構造化世界モデルの自然構築ブロックを規定するフレームワークを提案する。
本研究では,隠れマルコフモデル (HMM) と線形切替力学系 (sLDS) を離散的・連続的モデリングのための自然な構築ブロックとして検討する。
このモジュラーアプローチは、受動的モデリング(生成、予測)と、同じアーキテクチャ内のアクティブコントロール(計画、意思決定)の両方をサポートする。
論文 参考訳(メタデータ) (2025-11-03T22:02:04Z) - NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.10695425442164]
NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文 参考訳(メタデータ) (2025-10-15T16:25:18Z) - DyMoDreamer: World Modeling with Dynamic Modulation [52.27044216359359]
深層強化学習(DRL)における重要なボトルネックはサンプル非効率である。
動的変調機構を組み込んだ新しいアルゴリズムDyMoDreamerを導入し,動的特徴抽出の改善と時間情報の充実を図る。
実験によると、DyMoDreamer は Atari 100$k ベンチマークに新しい最先端のスコアをセットし、平均156.6$% の人間正規化スコアを設定できる。
論文 参考訳(メタデータ) (2025-09-29T13:54:42Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。