論文の概要: Causal Object-Centric Models for Planning with Monte Carlo Tree Search
- arxiv url: http://arxiv.org/abs/2606.14418v1
- Date: Fri, 12 Jun 2026 12:55:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.903568
- Title: Causal Object-Centric Models for Planning with Monte Carlo Tree Search
- Title(参考訳): モンテカルロ木探索による計画のための因果的対象中心モデル
- Authors: Rodion Vakhitov, Leonid Ugadiarov, Alexey Skrynnik, Aleksandr Panov,
- Abstract要約: COMETはモンテカルロ木探索を行うモデルベース強化学習アルゴリズムである。
ポリシーとバリューヘッドは、学習されたスロットごとのレバレンススコアによってトークン間の相互作用を変調するオブジェクト・カウザリの注意を使用する。
COMETは、トレーニングの初期段階において、オブジェクト中心のベースラインやモノリシックなベースラインよりも平均正規化スコアが高い。
- 参考スコア(独自算出の注目度): 49.61977404247856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce COMET (Causal Object-centric Model for Efficient Tree search), a model-based reinforcement learning algorithm that performs Monte Carlo Tree Search in a slot-structured latent space. COMET pairs a frozen unsupervised object-centric encoder with a transformer-based world model, in which actions are bound to objects through a novel action-slot fusion mechanism that is used in slot transition prediction. Policy and value heads use object-causal attention, modulating token interactions by learned per-slot relevance scores so that decision-making concentrates on task-relevant entities. COMET adds an explicit object-level inductive bias to MuZero-style latent planning. Across eight visually and dynamically diverse tasks from the Object-Centric Visual RL benchmark, ManiSkill, Robosuite, and VizDoom, COMET achieves a higher mean normalized score during the early stages of training compared to object-centric and monolithic baselines.
- Abstract(参考訳): 本稿では,モンテカルロ木探索を行うモデルベース強化学習アルゴリズムであるCOMET(Causal Object-centric Model for Efficient Tree Search)を紹介する。
COMETは、凍結した教師なしのオブジェクト中心エンコーダとトランスフォーマーベースの世界モデルとをペアリングし、スロット遷移予測に使用される新しいアクションスロット融合機構を通じて、アクションをオブジェクトにバインドする。
ポリシーとバリューヘッドは、学習されたスロットごとの関連性スコアによるトークンの相互作用を調整し、意思決定がタスク関連エンティティに集中するように、オブジェクト因果注意を使用する。
COMET は MuZero スタイルの潜在計画に明示的なオブジェクトレベルの帰納バイアスを追加する。
Object-Centric Visual RLベンチマーク、ManiSkill、Robosuite、VizDoomの8つの視覚的および動的に多様なタスクに対して、COMETは、オブジェクト中心のベースラインやモノリシックなベースラインと比較して、トレーニングの初期段階における平均正規化スコアを高くする。
関連論文リスト
- Object-Centric World Models Meet Monte Carlo Tree Search [49.12393425510251]
本稿では,オブジェクトレベルの表現のパワーを利用して動的環境をモデル化する,新しい強化学習(RL)アルゴリズムであるObjectZeroを紹介する。
本手法では,複数のオブジェクト間の複雑な相互作用を捉えるために,グラフニューラルネットワーク(GNN)を用いる。
多様なインタラクティブなオブジェクトで複雑な設定でアルゴリズムを訓練し、オブジェクトのダイナミクスを効果的に学習し、予測する能力を実証した。
論文 参考訳(メタデータ) (2026-01-10T15:59:17Z) - Slot Structured World Models [0.0]
最先端のアプローチでは、フィードフォワードエンコーダを使用して、オブジェクトの埋め込みを抽出し、潜在グラフニューラルネットワークを使用して、オブジェクトの埋め込み間の相互作用をモデル化する。
Slot Structured World Models (SSWM)は、オブジェクト中心のエンコーダと潜在グラフベースの動的モデルを組み合わせた世界モデルのクラスである。
論文 参考訳(メタデータ) (2024-01-08T21:19:30Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - An Object SLAM Framework for Association, Mapping, and High-Level Tasks [12.62957558651032]
本稿では,オブジェクト指向認識とオブジェクト指向ロボットタスクに焦点を当てた包括的オブジェクトSLAMフレームワークを提案する。
提案したオブジェクトSLAMフレームワークを効率よく評価するために,さまざまな公開データセットと実世界の結果が使用されている。
論文 参考訳(メタデータ) (2023-05-12T08:10:14Z) - Detecting Human-Object Interactions with Object-Guided Cross-Modal
Calibrated Semantics [6.678312249123534]
我々は,オブジェクト指向の統計モデルを用いて,エンドツーエンドのモデルを強化することを目指している。
本稿では,Verb Semantic Model (VSM) とセマンティックアグリゲーション(セマンティックアグリゲーション)を用いて,このオブジェクト誘導階層から利益を得る方法を提案する。
上記のモジュールの組み合わせは、オブジェクト指向クロスモーダルネットワーク(OCN)を構成する。
論文 参考訳(メタデータ) (2022-02-01T07:39:04Z) - SORNet: Spatial Object-Centric Representations for Sequential
Manipulation [39.88239245446054]
シーケンシャルな操作タスクでは、ロボットが環境の状態を認識し、望ましい目標状態につながる一連のアクションを計画する必要がある。
本研究では,対象対象の標準視に基づくRGB画像からオブジェクト中心表現を抽出するSORNetを提案する。
論文 参考訳(メタデータ) (2021-09-08T19:36:29Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z) - A Unified Object Motion and Affinity Model for Online Multi-Object
Tracking [127.5229859255719]
オブジェクトの動きと親和性モデルを単一のネットワークに統一する新しいMOTフレームワークUMAを提案する。
UMAは、単一物体追跡とメートル法学習をマルチタスク学習により統合された三重項ネットワークに統合する。
我々は,タスク認識機能学習を促進するために,タスク固有のアテンションモジュールを装備する。
論文 参考訳(メタデータ) (2020-03-25T09:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。