論文の概要: Imagined Autocurricula
- arxiv url: http://arxiv.org/abs/2509.13341v2
- Date: Sun, 28 Sep 2025 18:24:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 17:47:09.227397
- Title: Imagined Autocurricula
- Title(参考訳): 想像上のオートクラキュラ
- Authors: Ahmet H. Güzel, Matthew Thomas Jackson, Jarek Luca Liesen, Tim Rocktäschel, Jakob Nicolaus Foerster, Ilija Bogunovic, Jack Parker-Holder,
- Abstract要約: 組み込まれた環境で行動する訓練エージェントは、通常、膨大なトレーニングデータや正確なシミュレーションへのアクセスを必要とする。
オフラインで受動的に収集されたデータを活用する代替手段として、世界モデルが登場しつつある。
我々は、生成された世界に対して自動カリキュラムを誘導するIMACを提案する。
- 参考スコア(独自算出の注目度): 37.48175026521408
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Training agents to act in embodied environments typically requires vast training data or access to accurate simulation, neither of which exists for many cases in the real world. Instead, world models are emerging as an alternative leveraging offline, passively collected data, they make it possible to generate diverse worlds for training agents in simulation. In this work, we harness world models to generate imagined environments to train robust agents capable of generalizing to novel task variations. One of the challenges in doing this is ensuring the agent trains on useful generated data. We thus propose a novel approach, IMAC (Imagined Autocurricula), leveraging Unsupervised Environment Design (UED), which induces an automatic curriculum over generated worlds. In a series of challenging, procedurally generated environments, we show it is possible to achieve strong transfer performance on held-out environments, having trained only inside a world model learned from a narrower dataset. We believe this opens the path to utilizing larger-scale, foundation world models for generally capable agents.
- Abstract(参考訳): 具体化された環境で行動する訓練エージェントは、通常、膨大なトレーニングデータや正確なシミュレーションへのアクセスを必要とする。
代わりに、オフラインで受動的に収集されたデータを活用する代替手段として、世界モデルが登場している。
本研究では、世界モデルを用いて、新しいタスクのバリエーションを一般化できる堅牢なエージェントを訓練する。
これを行う上での課題の1つは、エージェントが有用な生成されたデータでトレーニングすることである。
そこで我々は,非教師付き環境設計(UED)を活用した新しい手法 IMAC (Imagined Autocurricula) を提案する。
一連の困難で手続き的に生成された環境において、より狭いデータセットから学習した世界モデル内でのみトレーニングされた保持環境において、強力な転送性能を実現することができることを示す。
これは、より大規模で基礎的な世界モデルを利用して、一般的に有能なエージェントに活用するための道を開くと信じている。
関連論文リスト
- A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - Exploration-Driven Generative Interactive Environments [53.05314852577144]
我々は、低コストで自動収集されたインタラクションデータに多くの仮想環境を使用することに重点を置いている。
仮想環境におけるランダムエージェントのみを用いたトレーニングフレームワークを提案する。
我々のエージェントは環境固有の報酬に完全に依存しているため、新しい環境に容易に適応できる。
論文 参考訳(メタデータ) (2025-04-03T12:01:41Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - One-shot World Models Using a Transformer Trained on a Synthetic Prior [37.027893127637036]
ワンショット世界モデル(英: One-Shot World Model、OSWM)は、純粋に合成データからコンテキスト内学習形式で学習されるトランスフォーマー世界モデルである。
OSWMは、シンプルなグリッド世界のダイナミクスや、CartPoleのジム、カスタムコントロール環境に迅速に適応できる。
論文 参考訳(メタデータ) (2024-09-21T09:39:32Z) - Learning Curricula in Open-Ended Worlds [17.138779075998084]
この論文は、Unsupervised Environment Design (UED)と呼ばれる手法のクラスを開発する。
環境設計空間が与えられたら、UEDは自動的に訓練環境の無限のシーケンスやカリキュラムを生成する。
本論文は,UEDオートキュリキュラがRL薬を産生し,ロバスト性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2023-12-03T16:44:00Z) - OPEn: An Open-ended Physics Environment for Learning Without a Task [132.6062618135179]
オープンエンドな物理環境で学んだ世界のモデルが、特定のタスクを伴わずに、下流の物理推論タスクに再利用できるかどうかについて検討する。
我々は,OPEn(Open-ended Physics ENvironment)のベンチマークを構築し,この環境における学習表現をテストするためのいくつかのタスクを明示的に設計する。
その結果、教師なしのコントラスト学習を表現学習に用いたエージェントと、探索のためのインパクト駆動学習が最良の結果となった。
論文 参考訳(メタデータ) (2021-10-13T17:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。