論文の概要: Object-Centric World Models Meet Monte Carlo Tree Search
- arxiv url: http://arxiv.org/abs/2601.06604v1
- Date: Sat, 10 Jan 2026 15:59:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.895758
- Title: Object-Centric World Models Meet Monte Carlo Tree Search
- Title(参考訳): モンテカルロ木探索とオブジェクト中心の世界モデル
- Authors: Rodion Vakhitov, Leonid Ugadiarov, Aleksandr Panov,
- Abstract要約: 本稿では,オブジェクトレベルの表現のパワーを利用して動的環境をモデル化する,新しい強化学習(RL)アルゴリズムであるObjectZeroを紹介する。
本手法では,複数のオブジェクト間の複雑な相互作用を捉えるために,グラフニューラルネットワーク(GNN)を用いる。
多様なインタラクティブなオブジェクトで複雑な設定でアルゴリズムを訓練し、オブジェクトのダイナミクスを効果的に学習し、予測する能力を実証した。
- 参考スコア(独自算出の注目度): 49.12393425510251
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce ObjectZero, a novel reinforcement learning (RL) algorithm that leverages the power of object-level representations to model dynamic environments more effectively. Unlike traditional approaches that process the world as a single undifferentiated input, our method employs Graph Neural Networks (GNNs) to capture intricate interactions among multiple objects. These objects, which can be manipulated and interact with each other, serve as the foundation for our model's understanding of the environment. We trained the algorithm in a complex setting teeming with diverse, interactive objects, demonstrating its ability to effectively learn and predict object dynamics. Our results highlight that a structured world model operating on object-centric representations can be successfully integrated into a model-based RL algorithm utilizing Monte Carlo Tree Search as a planning module.
- Abstract(参考訳): 本稿では、オブジェクトレベルの表現のパワーを利用して動的環境をより効率的にモデル化する、新しい強化学習(RL)アルゴリズムであるObjectZeroを紹介する。
単一の未分化な入力として世界を処理する従来のアプローチとは異なり、我々の手法はグラフニューラルネットワーク(GNN)を用いて複数のオブジェクト間の複雑な相互作用をキャプチャする。
これらのオブジェクトは互いに操作したり相互作用したりすることができ、私たちのモデルが環境を理解する基盤として役立ちます。
多様なインタラクティブなオブジェクトで複雑な設定でアルゴリズムを訓練し、オブジェクトのダイナミクスを効果的に学習し、予測する能力を実証した。
その結果,モンテカルロ木探索を計画モジュールとして用いたモデルベースRLアルゴリズムに,オブジェクト中心表現で動作する構造化世界モデルをうまく組み込むことができた。
関連論文リスト
- Learning Interactive World Model for Object-Centric Reinforcement Learning [27.710001478315288]
我々は、世界モデル内で、オブジェクトとそれらの相互作用の構造化表現を学習する統一的なフレームワークを導入する。
FIOC-WMは、オブジェクト相互作用のアンタングルおよびモジュラー表現で環境力学をキャプチャする。
FIOC-WMは、シミュレーションされたロボットと組み込みAIベンチマークにおいて、世界モデルベースラインに対するポリシー学習サンプル効率と一般化を改善している。
論文 参考訳(メタデータ) (2025-11-04T03:35:58Z) - SOLD: Slot Object-Centric Latent Dynamics Models for Relational Manipulation Learning from Pixels [16.020835290802548]
Slot-Attention for Object-centric Latent Dynamicsは、新しいモデルに基づく強化学習アルゴリズムである。
画素入力から教師なしの方法でオブジェクト中心のダイナミックスモデルを学習する。
構造化潜在空間は、モデル解釈可能性を改善するだけでなく、振る舞いモデルが推論する価値のある入力空間も提供することを実証する。
論文 参考訳(メタデータ) (2024-10-11T14:03:31Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Slot Structured World Models [0.0]
最先端のアプローチでは、フィードフォワードエンコーダを使用して、オブジェクトの埋め込みを抽出し、潜在グラフニューラルネットワークを使用して、オブジェクトの埋め込み間の相互作用をモデル化する。
Slot Structured World Models (SSWM)は、オブジェクト中心のエンコーダと潜在グラフベースの動的モデルを組み合わせた世界モデルのクラスである。
論文 参考訳(メタデータ) (2024-01-08T21:19:30Z) - Relational Object-Centric Actor-Critic [44.99833362998488]
近年の研究では、アンタングルオブジェクト表現は、イメージベースでオブジェクト中心の強化学習タスクにおけるポリシー学習に役立つことが強調されている。
本稿では,アクタ批判的アプローチとモデルに基づくアプローチを統合した,オブジェクト中心強化学習アルゴリズムを提案する。
シミュレーションされた3次元ロボット環境と構成構造を持つ2次元環境において,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T06:05:12Z) - Continual Visual Reinforcement Learning with A Life-Long World Model [55.05017177980985]
視覚力学モデリングのための新しい連続学習手法を提案する。
まず,タスク固有の潜在ダイナミクスを学習する長寿命世界モデルを紹介する。
そして,探索・保守的行動学習手法を用いて,過去の課題に対する価値推定問題に対処する。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Model-free Representation Learning and Exploration in Low-rank MDPs [64.72023662543363]
低位mdpに対して,最初のモデルフリー表現学習アルゴリズムを提案する。
主要なアルゴリズムの貢献は新しいミニマックス表現の学習の目的です。
結果は複雑な環境にスケールする一般的な関数近似を収容できます。
論文 参考訳(メタデータ) (2021-02-14T00:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。