論文の概要: HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym
- arxiv url: http://arxiv.org/abs/2505.22597v1
- Date: Wed, 28 May 2025 17:10:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.754566
- Title: HDDLGym: A Tool for Studying Multi-Agent Hierarchical Problems Defined in HDDL with OpenAI Gym
- Title(参考訳): HDDLGym: OpenAI Gymを用いたHDDLで定義されたマルチエージェント階層問題の研究ツール
- Authors: Ngoc La, Ruaridh Mon-Williams, Julie A. Shah,
- Abstract要約: 強化学習(RL)メソッドはOpenAI Gymのようなツールを使って広くテストされている。
RLとの階層的計画のシームレスな統合を可能にするツールがない。
我々は、HDDLドメインと問題からOpenAI Gym環境を自動的に生成するPythonベースのツールであるHDDLGymを紹介する。
- 参考スコア(独自算出の注目度): 7.365229047837842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, reinforcement learning (RL) methods have been widely tested using tools like OpenAI Gym, though many tasks in these environments could also benefit from hierarchical planning. However, there is a lack of a tool that enables seamless integration of hierarchical planning with RL. Hierarchical Domain Definition Language (HDDL), used in classical planning, introduces a structured approach well-suited for model-based RL to address this gap. To bridge this integration, we introduce HDDLGym, a Python-based tool that automatically generates OpenAI Gym environments from HDDL domains and problems. HDDLGym serves as a link between RL and hierarchical planning, supporting multi-agent scenarios and enabling collaborative planning among agents. This paper provides an overview of HDDLGym's design and implementation, highlighting the challenges and design choices involved in integrating HDDL with the Gym interface, and applying RL policies to support hierarchical planning. We also provide detailed instructions and demonstrations for using the HDDLGym framework, including how to work with existing HDDL domains and problems from International Planning Competitions, exemplified by the Transport domain. Additionally, we offer guidance on creating new HDDL domains for multi-agent scenarios and demonstrate the practical use of HDDLGym in the Overcooked domain. By leveraging the advantages of HDDL and Gym, HDDLGym aims to be a valuable tool for studying RL in hierarchical planning, particularly in multi-agent contexts.
- Abstract(参考訳): 近年,OpenAI Gymのようなツールを用いて強化学習(RL)手法が広くテストされている。
しかし、RLとの階層的計画のシームレスな統合を可能にするツールが欠如している。
階層的ドメイン定義言語(HDDL)は、古典的な計画で使われ、モデルベースのRLがこのギャップに対処するのに適した構造化アプローチを導入します。
この統合を橋渡しするために、HDDLドメインと問題からOpenAI Gym環境を自動的に生成するPythonベースのツールであるHDDLGymを紹介します。
HDDLGymはRLと階層計画のリンクとして機能し、マルチエージェントシナリオをサポートし、エージェント間の協調計画を可能にする。
本稿では,HDDLGymの設計と実装の概要を述べるとともに,HDDLとGymインターフェースを統合する上での課題と設計選択を強調し,階層的計画を支援するためにRLポリシーを適用する。
また、既存のHDDLドメインとの連携方法や国際計画コンペティションの問題点など、トランスポートドメインで実証したHDDLGymフレームワークの詳細な説明やデモも提供する。
さらに、マルチエージェントシナリオのための新しいHDDLドメインを作成するためのガイダンスを提供し、オーバークッキングドメインにおけるHDDLGymの実用性を実証する。
HDDLとGymの利点を活用することで、HDDLGymは階層的な計画、特にマルチエージェントのコンテキストにおいて、RLを研究する上で価値のあるツールになることを目指している。
関連論文リスト
- HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases [57.51078142561683]
大規模言語モデル(LLM)は、ハードウェア設計タスクにおいてその可能性を実証している。
しかし、実際のリポジトリレベルのHDLプロジェクトでのパフォーマンスは、数千から数万のコード行で妨げられています。
グラフ検索拡張生成(Graph RAG)とLLMを統合する新しいフレームワークであるHDLxGraphを提案する。
論文 参考訳(メタデータ) (2025-05-21T16:14:10Z) - Planning with Vision-Language Models and a Use Case in Robot-Assisted Teaching [0.9217021281095907]
本稿では、視覚言語モデル(VLM)を利用して、初期状態の画像や目標状態の記述を自動的にPDDL問題に変換する新しいフレームワークであるImage2PDDLを紹介する。
ブロックワールドやスライディングタイルパズルのような標準的な計画領域を含む,さまざまな領域におけるフレームワークの評価を,複数の難易度を持つデータセットを用いて行う。
本稿では,自閉症スペクトラム障害児のロボット支援教育における可能性について論じる。
論文 参考訳(メタデータ) (2025-01-29T14:04:54Z) - LLAVIDAL: A Large LAnguage VIsion Model for Daily Activities of Living [15.062325300795257]
現在のLarge Language Models(LLVM)は、一般的な理解ではよく機能するが、詳細な時間的詳細には耐えられない。
この制限は、特別なADLビデオの授業調整と、モダリティ統合の欠如に起因している。
本稿では,多視点マルチモーダル RGBS 命令チューニングデータセットである ADL-X を作成した ADL データセットの半きめ細かいフレームワークを提案する。
ADLの複雑な関係をモデル化するために,ビデオ,3Dスケルトン,HOIをLLVMに統合するLLAVIDALも導入した。
論文 参考訳(メタデータ) (2024-06-13T17:59:05Z) - Real-World Planning with PDDL+ and Beyond [55.73913765642435]
我々は、軽量さ、単純さ、そして最も重要なのは適応性を強調するために作られた新しいPDDL+プランナーであるNyxを紹介する。
Nyxは、ある種のAIプランニングを必要とする事実上の現実世界のアプリケーションに合わせることができ、現実の問題を解決するための計画手法をより広く採用するための道を開くことができる。
論文 参考訳(メタデータ) (2024-02-19T07:35:49Z) - Serving Deep Learning Model in Relational Databases [70.53282490832189]
リレーショナルデータ上での深層学習(DL)モデルの実現は、様々な商業分野や科学分野において重要な要件となっている。
最先端のDL中心アーキテクチャは、DL計算を専用のDLフレームワークにオフロードします。
UDF中心アーキテクチャの可能性は、リレーショナルデータベース管理システム(RDBMS)内の1つ以上のテンソル計算をユーザ定義関数(UDF)にカプセル化する。
論文 参考訳(メタデータ) (2023-10-07T06:01:35Z) - HDDL 2.1: Towards Defining a Formalism and a Semantics for Temporal HTN
Planning [64.07762708909846]
現実世界のアプリケーションは、リッチで多様な自動計画問題をモデル化する必要があります。
階層的タスクネットワーク(HTN)形式は、数値的および時間的制約を伴う計画問題の表現を許さない。
本稿では,HDDLとこれらの運用ニーズのギャップを埋めるとともに,PDDL 2.1からインスピレーションを得てHDDLを拡張することを提案する。
論文 参考訳(メタデータ) (2023-06-12T18:21:23Z) - HDDL 2.1: Towards Defining an HTN Formalism with Time [0.0]
産業やロボティクスなどの計画の現実的な応用には、リッチで多様なシナリオをモデル化する必要がある。
それらの解像度は通常、協調された同時アクション実行を必要とする。
いくつかのケースでは、そのような計画問題は階層的な方法で自然に分解され、階層的なタスクネットワーク形式によって表現される。
本稿では,HDDLの拡張に必要なセマンティクスと構文について論じるとともに,地球観測衛星計画問題のモデル化について述べる。
論文 参考訳(メタデータ) (2022-06-03T21:22:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。