論文の概要: Predicting the Future with Simple World Models
- arxiv url: http://arxiv.org/abs/2401.17835v1
- Date: Wed, 31 Jan 2024 13:52:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-01 14:26:57.573017
- Title: Predicting the Future with Simple World Models
- Title(参考訳): シンプルな世界モデルによる未来予測
- Authors: Tankred Saanum, Peter Dayan, Eric Schulz
- Abstract要約: 本稿では,世界モデルの潜在力学を単純化する正規化手法を提案する。
我々の正規化は下流タスクの精度、一般化、性能を改善する。
- 参考スコア(独自算出の注目度): 12.051527678467775
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World models can represent potentially high-dimensional pixel observations in
compact latent spaces, making it tractable to model the dynamics of the
environment. However, the latent dynamics inferred by these models may still be
highly complex. Abstracting the dynamics of the environment with simple models
can have several benefits. If the latent dynamics are simple, the model may
generalize better to novel transitions, and discover useful latent
representations of environment states. We propose a regularization scheme that
simplifies the world model's latent dynamics. Our model, the Parsimonious
Latent Space Model (PLSM), minimizes the mutual information between latent
states and the dynamics that arise between them. This makes the dynamics softly
state-invariant, and the effects of the agent's actions more predictable. We
combine the PLSM with three different model classes used for i) future latent
state prediction, ii) video prediction, and iii) planning. We find that our
regularization improves accuracy, generalization, and performance in downstream
tasks.
- Abstract(参考訳): 世界モデルは、コンパクトな潜在空間で潜在的に高次元のピクセル観測を表現でき、環境のダイナミクスをモデル化することができる。
しかし、これらのモデルによって推定される潜在力学は依然として非常に複雑である。
単純なモデルによる環境のダイナミクスの抽象化には,いくつかのメリットがある。
潜在力学が単純であれば、モデルはより新しい遷移に一般化し、環境状態の有用な潜在表現を見つけることができる。
我々は,世界モデルの潜在力学を単純化する正規化スキームを提案する。
我々のモデルであるParsimonious Latent Space Model (PLSM)は、潜在状態とそれらの間に生じるダイナミクスの間の相互情報を最小化する。
これにより、動的に状態不変となり、エージェントのアクションの効果がより予測可能となる。
plsmと3つの異なるモデルクラスを組み合わせることで
i) 将来の潜在状態予測
二 ビデオの予測、及び
三 計画を立てる。
我々の正規化は下流タスクの精度、一般化、性能を改善する。
関連論文リスト
- Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Improving Deep Dynamics Models for Autonomous Vehicles with Multimodal
Latent Mapping of Surfaces [23.023397401781757]
そこで本稿では,潜伏変数ベクトルに条件付けすることで表面認識力学モデルを学ぶ新しい手法を提案する。
潜時マッパーは、複数のモードからの推論中にこれらの潜時変数を更新するように訓練される。
このモデルを用いることで、様々な面および困難面において駆動性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2023-03-21T11:21:31Z) - Learning Robust Dynamics through Variational Sparse Gating [18.476155786474358]
多くのオブジェクトを持つ環境では、少数のオブジェクトが同時に動いたり相互作用したりしているのが普通です。
本稿では,このスパース相互作用の帰納バイアスを,画素から学習した世界モデルの潜在ダイナミクスに統合する。
論文 参考訳(メタデータ) (2022-10-21T02:56:51Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z) - Analysis of ODE2VAE with Examples [0.0]
通常微分方程式変分オートエンコーダ(ODE2VAE)は、潜時変分モデルである。
モデルが意味のある潜在表現をある程度学習できることを示す。
論文 参考訳(メタデータ) (2021-08-10T20:12:26Z) - TCL: Transformer-based Dynamic Graph Modelling via Contrastive Learning [87.38675639186405]
我々は,動的に進化するグラフを連続的に扱う,TCLと呼ばれる新しいグラフニューラルネットワークアプローチを提案する。
我々の知る限りでは、これは動的グラフ上の表現学習にコントラスト学習を適用する最初の試みである。
論文 参考訳(メタデータ) (2021-05-17T15:33:25Z) - Autoregressive Dynamics Models for Offline Policy Evaluation and
Optimization [60.73540999409032]
表現的自己回帰ダイナミクスモデルが次の状態の異なる次元を生成し、以前の次元で順次条件付きで報酬を得ることを示す。
また,リプレイバッファを充実させる手段として,自己回帰的ダイナミクスモデルがオフラインポリシー最適化に有用であることを示す。
論文 参考訳(メタデータ) (2021-04-28T16:48:44Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z) - Context-aware Dynamics Model for Generalization in Model-Based
Reinforcement Learning [124.9856253431878]
グローバルなダイナミクスモデルを学習するタスクを,(a)ローカルなダイナミクスをキャプチャするコンテキスト潜在ベクトルを学習し,(b)次に条件付き状態を予測するという2つの段階に分割する。
本研究では,コンテキスト潜在ベクトルに動的情報をエンコードするために,コンテキスト潜在ベクトルを前方と後方の両方のダイナミクスを予測するのに役立つような新しい損失関数を導入する。
提案手法は,既存のRL方式と比較して,様々なシミュレーションロボットや制御タスクの一般化能力に優れる。
論文 参考訳(メタデータ) (2020-05-14T08:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。