論文の概要: NovelGym: A Flexible Ecosystem for Hybrid Planning and Learning Agents
Designed for Open Worlds
- arxiv url: http://arxiv.org/abs/2401.03546v1
- Date: Sun, 7 Jan 2024 17:13:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-01-09 18:30:38.511910
- Title: NovelGym: A Flexible Ecosystem for Hybrid Planning and Learning Agents
Designed for Open Worlds
- Title(参考訳): novelgym: オープンワールドのためのハイブリッド計画と学習エージェントのための柔軟なエコシステム
- Authors: Shivam Goel, Yichen Wei, Panagiotis Lymperopoulos, Matthias Scheutz,
Jivko Sinapov
- Abstract要約: NovelGymはグリッドワールド環境をシミュレートするフレキシブルなエコシステムである。
オープンワールドにおける強化学習(RL)とハイブリッド計画および学習エージェントのベンチマークのための堅牢なプラットフォームとして機能する。
- 参考スコア(独自算出の注目度): 18.53489803464924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As AI agents leave the lab and venture into the real world as autonomous
vehicles, delivery robots, and cooking robots, it is increasingly necessary to
design and comprehensively evaluate algorithms that tackle the ``open-world''.
To this end, we introduce NovelGym, a flexible and adaptable ecosystem designed
to simulate gridworld environments, serving as a robust platform for
benchmarking reinforcement learning (RL) and hybrid planning and learning
agents in open-world contexts. The modular architecture of NovelGym facilitates
rapid creation and modification of task environments, including multi-agent
scenarios, with multiple environment transformations, thus providing a dynamic
testbed for researchers to develop open-world AI agents.
- Abstract(参考訳): aiエージェントが研究室を出て、自動運転車、配達ロボット、調理ロボットとして現実世界に参入するにつれ、'オープンワールド'に取り組むアルゴリズムをデザインし、総合的に評価する必要がある。
この目的のために,グリッドワールド環境をシミュレートするフレキシブルで適応可能なエコシステムであるnovellgymを導入し,オープンワールドコンテキストにおける強化学習(rl)とハイブリッド計画および学習エージェントのベンチマークのための強固なプラットフォームとして機能する。
novelgymのモジュラーアーキテクチャは、複数の環境変換を伴うマルチエージェントシナリオを含むタスク環境の迅速な作成と修正を促進し、研究者がオープンワールドaiエージェントを開発するための動的テストベッドを提供する。
関連論文リスト
- SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement [81.30121762971473]
SynWorldは、エージェントが自律的に環境を探索し、最適化し、アクションに対する理解を深めることを可能にするフレームワークである。
実験の結果,SynWorldは新しい環境下での行動知識の学習に効果的で汎用的なアプローチであることを実証した。
論文 参考訳(メタデータ) (2025-04-04T16:10:57Z) - Exploration-Driven Generative Interactive Environments [53.05314852577144]
我々は、低コストで自動収集されたインタラクションデータに多くの仮想環境を使用することに重点を置いている。
仮想環境におけるランダムエージェントのみを用いたトレーニングフレームワークを提案する。
我々のエージェントは環境固有の報酬に完全に依存しているため、新しい環境に容易に適応できる。
論文 参考訳(メタデータ) (2025-04-03T12:01:41Z) - LLM-mediated Dynamic Plan Generation with a Multi-Agent Approach [1.0124625066746595]
動的環境に適応可能なネットワークを生成する手法を提案する。
提案手法は, 条件や目標を表す「統計」を収集し, エージェントの生成に利用する。
これらのエージェントは特定の条件に基づいて相互接続され、結果として柔軟性と一般性を組み合わせたネットワークとなる。
論文 参考訳(メタデータ) (2025-04-02T11:42:49Z) - Inter-environmental world modeling for continuous and compositional dynamics [7.01176359680407]
環境全体にわたってシミュレートする継続的潜在アクション表現を学習する、教師なしのフレームワークであるLie Actionを紹介した。
WLAはビデオフレームのみを用いてトレーニングが可能であり、アクションラベルが最小でも無ければ、新しいアクションセットを持つ新しい環境に迅速に適応できることを実証する。
論文 参考訳(メタデータ) (2025-03-13T00:02:54Z) - Curiosity-Driven Imagination: Discovering Plan Operators and Learning Associated Policies for Open-World Adaptation [7.406934849952094]
動的で不確実な環境に素早く適応することは、ロボット工学における大きな課題である。
従来のタスク・アンド・モーション・プランニングアプローチは、予期せぬ変化に対処し、適応するときにデータ非効率であり、学習中に世界モデルを活用するのに苦労する。
我々はこの問題を、2つのモデルを統合するハイブリッド計画学習システムで解決する: 遷移を学習し、固有の好奇性モジュール(ICM)による探索を駆動する低レベルニューラルネットワークベースモデル。
シーケンシャル・ノベルティ・インジェクションを用いたロボット操作領域における評価は、我々のアプローチがより高速に収束し、最先端のハイブリッド手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-03-06T20:02:26Z) - Trajectory World Models for Heterogeneous Environments [67.27233466954814]
環境を横断するセンサーやアクチュエータの不均一性は、大規模な事前訓練された世界モデルを構築する上で大きな課題となる。
我々は80の環境から100万以上のトラジェクトリからなる統一データセットUniTrajを紹介した。
本稿では,様々なセンサやアクチュエータ情報を柔軟に処理し,環境ダイナミクスをコンテキスト内で捉えることのできる,新しいアーキテクチャであるTrajWorldを提案する。
論文 参考訳(メタデータ) (2025-02-03T13:59:08Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization [66.22117723598872]
マルチモーダルWebエージェントの開発を容易にするために設計されたオープンソースフレームワークを紹介する。
まず、基本モデルを模倣学習で訓練し、基礎能力を得る。
次に、エージェントにオープンウェブを探索させ、その軌道に関するフィードバックを収集する。
論文 参考訳(メタデータ) (2024-10-25T15:01:27Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - Learning Curricula in Open-Ended Worlds [17.138779075998084]
この論文は、Unsupervised Environment Design (UED)と呼ばれる手法のクラスを開発する。
環境設計空間が与えられたら、UEDは自動的に訓練環境の無限のシーケンスやカリキュラムを生成する。
本論文は,UEDオートキュリキュラがRL薬を産生し,ロバスト性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2023-12-03T16:44:00Z) - Arbitrarily Scalable Environment Generators via Neural Cellular Automata [55.150593161240444]
NCA環境ジェネレータは, 環境サイズに関わらず, 整合性, 規則化されたパターンを維持可能であることを示す。
提案手法は,類似したパターンを持つ大規模環境に対して,単エージェント強化学習ポリシーを任意に拡張する。
論文 参考訳(メタデータ) (2023-10-28T07:30:09Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z) - GriddlyJS: A Web IDE for Reinforcement Learning [7.704064306361941]
GriddlyエンジンをベースとしたWebベースの統合開発環境(IDE)であるGriddlyJSを紹介します。
GriddlyJSは、任意の複雑なPCGグリッドワールド環境を視覚的に設計し、デバッグすることを可能にする。
RLワークフローをモダンなWeb標準によって実現された高度な機能に接続することで、GriddlyJSはインタラクティブなエージェント環境のデモを公開することができる。
論文 参考訳(メタデータ) (2022-07-13T10:26:38Z) - SAGCI-System: Towards Sample-Efficient, Generalizable, Compositional,
and Incremental Robot Learning [41.19148076789516]
上記の4つの要件を満たすために,SAGCIシステムと呼ばれる体系的な学習フレームワークを導入する。
本システムはまず,ロボットの手首に搭載されたカメラによって収集された生点雲を入力とし,URDFに代表される周囲環境の初期モデリングを生成する。
そのロボットは、対話的な知覚を利用して環境と対話し、URDFのオンライン検証と修正を行う。
論文 参考訳(メタデータ) (2021-11-29T16:53:49Z) - Modular Procedural Generation for Voxel Maps [2.6811189633660613]
本稿では,Minecraft などのボクセル環境を対象とした PCG アルゴリズムの実装を容易にするオープンソースライブラリ mcg を提案する。
この図書館は人間と機械のチーム研究を念頭に設計されており、世代に「トップダウン」なアプローチを採っている。
このアプローチの利点は、仮想環境の迅速でスケーラブルで効率的な開発、セマンティックレベルで環境の統計を制御できる機能、およびプレイヤーのアクションにリアルタイムで応答して新しい環境を生成する機能です。
論文 参考訳(メタデータ) (2021-04-18T16:21:35Z) - A Framework for Learning Predator-prey Agents from Simulation to Real
World [0.0]
本研究では,シミュレーションから実世界への展開が可能な進化型捕食ロボットシステムを提案する。
捕食者と獲物は共に、期待される行動を学ぶために、NeuroEvolution of Augmenting Topologies (NEAT)によって進化する。
ユーザの利便性のために、シミュレートされた実世界のソースコードとビデオがGithubで公開されている。
論文 参考訳(メタデータ) (2020-10-29T17:33:38Z) - The Chef's Hat Simulation Environment for Reinforcement-Learning-Based
Agents [54.63186041942257]
本稿では,人間-ロボットインタラクションのシナリオで使用されるように設計されたChef's Hatカードゲームを実装する仮想シミュレーション環境を提案する。
本稿では,強化学習アルゴリズムにおける制御可能かつ再現可能なシナリオを提案する。
論文 参考訳(メタデータ) (2020-03-12T15:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。