論文の概要: MetaWorld: Skill Transfer and Composition in a Hierarchical World Model for Grounding High-Level Instructions
- arxiv url: http://arxiv.org/abs/2601.17507v1
- Date: Sat, 24 Jan 2026 16:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.938374
- Title: MetaWorld: Skill Transfer and Composition in a Hierarchical World Model for Grounding High-Level Instructions
- Title(参考訳): MetaWorld:ハイレベルインストラクションのための階層型世界モデルにおけるスキル伝達と構成
- Authors: Yutong Shen, Hangxu Liu, Kailin Pei, Ruizhe Xia, Tongtong Feng,
- Abstract要約: セマンティックプランニングと物理制御を統合した階層型世界モデルであるMetaWorldを提案する。
タスク完了と動作コヒーレンスにおいて,世界モデルベースRLよりも優れることを示す。
- 参考スコア(独自算出の注目度): 2.6994954303270564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humanoid robot loco-manipulation remains constrained by the semantic-physical gap. Current methods face three limitations: Low sample efficiency in reinforcement learning, poor generalization in imitation learning, and physical inconsistency in VLMs. We propose MetaWorld, a hierarchical world model that integrates semantic planning and physical control via expert policy transfer. The framework decouples tasks into a VLM-driven semantic layer and a latent dynamics model operating in a compact state space. Our dynamic expert selection and motion prior fusion mechanism leverages a pre-trained multi-expert policy library as transferable knowledge, enabling efficient online adaptation via a two-stage framework. VLMs serve as semantic interfaces, mapping instructions to executable skills and bypassing symbol grounding. Experiments on Humanoid-Bench show MetaWorld outperforms world model-based RL in task completion and motion coherence. Our code will be found at https://anonymous.4open.science/r/metaworld-2BF4/
- Abstract(参考訳): ヒューマノイドロボットのロコ操作は、意味論的ギャップによって制約される。
現在の手法では、強化学習におけるサンプル効率の低さ、模倣学習における一般化の低さ、VLMにおける物理的不整合の3つの制限に直面している。
本稿では,専門家の方針伝達を通したセマンティックプランニングと物理的制御を統合した階層的世界モデルであるMetaWorldを提案する。
このフレームワークはタスクをVLM駆動のセマンティック層と、コンパクトな状態空間で動作する潜在ダイナミクスモデルに分離する。
我々の動的専門家選択と運動事前融合機構は、事前訓練されたマルチエキスパートポリシーライブラリを伝達可能な知識として活用し、2段階のフレームワークによる効率的なオンライン適応を可能にする。
VLMはセマンティックインターフェースとして機能し、命令を実行可能なスキルにマッピングし、シンボルグラウンドをバイパスする。
Humanoid-Benchの実験では、MetaWorldはタスク完了とモーションコヒーレンスにおいて世界モデルベースのRLを上回っている。
私たちのコードはhttps://anonymous.4open.science/r/metaworld-2BF4/で見られます。
関連論文リスト
- AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation [12.592383721590402]
オンライン適応学習(AdaWorldPolicy)を用いた統合フレームワーク「世界モデル駆動拡散政策」を導入する。
私たちの中核となる洞察は、世界モデルは強力な監視信号を提供し、動的環境におけるオンライン適応学習を可能にします。
AdaWorldPolicyは、アウト・オブ・ディストリビューションシナリオへの動的適応能力を備えた最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-02-23T17:12:25Z) - DM0: An Embodied-Native Vision-Language-Action Model towards Physical AI [84.9072161615971]
我々は,物理AI用に設計された身体的負の視覚・言語・アクション・フレームワークであるDM0を提案する。
当社の方法論は,事前トレーニング,中級トレーニング,ポストトライニングという,包括的な3段階のパイプラインに従っています。
RoboChallengeベンチマークの実験では、DM0はスペシャリストとジェネリリストの両方で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-16T17:59:16Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8381970762877]
VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-09T09:08:33Z) - Bridge Thinking and Acting: Unleashing Physical Potential of VLM with Generalizable Action Expert [60.88976842557026]
VLM(Vision-Language Models)は、優れた計画と推論能力を示している。
最近の二重系アプローチは「思考」と「行動」を分離しようとする
一般化可能なアクションエキスパートを中心としたフレームワークを紹介します。
論文 参考訳(メタデータ) (2025-10-04T18:33:27Z) - Hierarchical Language Models for Semantic Navigation and Manipulation in an Aerial-Ground Robotic System [8.88014241557266]
不均一なマルチロボットシステムは、協調的なハイブリッド協調を必要とする複雑なタスクにおいて大きな可能性を示す。
静的またはタスク固有のモデルに依存する既存のメソッドは、様々なタスクや動的環境にまたがる一般化性に欠けることが多い。
本稿では,大規模言語モデル (LLM) と微調整型視覚言語モデル (VLM) を統合した階層型マルチモーダルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-05T13:27:41Z) - Human-Object Interaction via Automatically Designed VLM-Guided Motion Policy [30.43930233035367]
VLM(Vision-Language Models)を利用した最初の統合物理ベースのHOフレームワークを紹介する。
VLM-Guided Relative Movement Dynamics (RMD)を導入する。これは、強化学習のための目標状態と報酬関数を自動的に構築する、微細な時間的二部運動表現である。
提案手法をサポートするために,何千もの長期の静的および動的相互作用計画を持つ新しいデータセットであるInterplayを提案する。
論文 参考訳(メタデータ) (2025-03-24T05:18:04Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.82457030180094]
本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-06-06T02:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。