論文の概要: OpenHA: A Series of Open-Source Hierarchical Agentic Models in Minecraft
- arxiv url: http://arxiv.org/abs/2509.13347v1
- Date: Sat, 13 Sep 2025 03:12:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.543511
- Title: OpenHA: A Series of Open-Source Hierarchical Agentic Models in Minecraft
- Title(参考訳): OpenHA:Minecraftにおけるオープンソースの階層型エージェントモデルのシリーズ
- Authors: Zihao Wang, Muyao Li, Kaichen He, Xiangyu Wang, Zhancun Mu, Anji Liu, Yitao Liang,
- Abstract要約: 単一のアクション空間が普遍的に最適でないことを示し、代わりに最も効果的な抽象化はタスク依存である。
単一のモノリシックなVLAモデル内に高レベルの計画と低レベルの制御を統合する新しいフレームワークであるChain of Actionを紹介します。
我々は、CoAパラダイムを用いた多種多様なアクション空間で訓練されたオールインワンエージェントが、より堅牢で一般化可能なポリシーを学ぶことを実証した。
- 参考スコア(独自算出の注目度): 41.54450963797897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The choice of action spaces is a critical yet unresolved challenge in developing capable, end-to-end trainable agents. This paper first presents a large-scale, systematic comparison of prominent abstracted action spaces and tokenizers for Vision-Language-Action (VLA) or hierarchical agent models in the open-ended Minecraft. Our analysis reveals that no single action space is universally optimal; instead, the most effective abstraction is highly task-dependent, creating a dilemma for building generalist agents. To resolve this, we introduce Chain of Action (CoA), a novel framework that unifies high-level planning and low-level control within a single, monolithic VLA model. CoA treats an abstracted action not as a command for a separate policy, but as an intermediate reasoning step--akin to a chain of thought--that guides the generation of the final, executable action. Furthermore, we demonstrate that an All-in-One agent trained on a diverse mixture of action spaces using the CoA paradigm learns a more robust and generalizable policy. This unified agent achieves a new state-of-the-art, improving the overall task success rate over strong, specialized baselines. To foster reproducible research, we release the OpenHA (Open Hierarchical Agents) suite, which includes our comprehensive benchmark of over 800 distinct tasks, curated datasets, source code, and all pretrained model checkpoints at https://github.com/CraftJarvis/OpenHA
- Abstract(参考訳): アクションスペースの選択は、有能でエンドツーエンドのトレーニング可能なエージェントを開発する上で、重要で未解決の課題である。
本稿ではまず,オープンエンドマインクラフトにおける視覚・言語・アクション(VLA)や階層的エージェントモデルのための,顕著な抽象的行動空間とトークン化器の大規模かつ体系的な比較について述べる。
我々の分析は、単一のアクション空間が普遍的に最適ではないことを明らかにし、代わりに最も効果的な抽象化はタスク依存であり、ジェネラリストエージェントを構築するためのジレンマを生成する。
この問題を解決するために、我々は単一のモノリシックVLAモデルで高レベルの計画と低レベルの制御を統合する新しいフレームワークであるChain of Action (CoA)を紹介します。
CoAは、抽象されたアクションを、独立したポリシーのコマンドではなく、中間的な推論ステップとして扱う。
さらに、CoAパラダイムを用いた多種多様なアクション空間で訓練されたオールインワンエージェントが、より堅牢で一般化可能なポリシーを学ぶことを実証する。
この統合されたエージェントは、新しい最先端を実現し、強力な特殊なベースラインよりも全体的なタスク成功率を向上させる。
再現可能な研究を促進するために、私たちはOpenHA(Open Hierarchical Agents)スイートをリリースした。このスイートには、800以上の異なるタスク、キュレートされたデータセット、ソースコード、およびトレーニング済みのすべてのモデルチェックポイントの包括的なベンチマークが含まれています。
関連論文リスト
- CausalMACE: Causality Empowered Multi-Agents in Minecraft Cooperative Tasks [16.633868216217948]
マルチエージェントシステムを強化するために設計された全体論的因果計画フレームワークCausalMACEを提案する。
提案フレームワークでは,グローバルなタスク計画のための包括的なタスクグラフと,依存性管理のための因果性ベースのモジュールの2つのモジュールを紹介した。
実験により,Minecraftのマルチエージェント協調作業における最先端性能を実証した。
論文 参考訳(メタデータ) (2025-08-26T08:29:05Z) - Multiple Weaks Win Single Strong: Large Language Models Ensemble Weak Reinforcement Learning Agents into a Supreme One [28.264011412168347]
モデルアンサンブルは強化学習(RL)において有効なエージェントの訓練に有用である。
LLM-Ensは,タスク固有の意味理解を用いてRLモデルのアンサンブルを強化する手法である。
論文 参考訳(メタデータ) (2025-05-21T09:35:43Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - Leveraging Large Language Models for Effective and Explainable Multi-Agent Credit Assignment [4.406086834602686]
シーケンス改善と帰属の2つのパターン認識問題に対する信用割当の修正方法を示す。
提案手法では,各エージェントの個々の貢献に基づいて,環境報酬を数値的に分解する集中型報酬批判を利用する。
どちらの手法も、Level-Based ForagingやRobotic Warehouse、衝突に関連する安全性の制約を取り入れたSpaceworldベンチマークなど、さまざまなベンチマークにおいて、最先端の手法よりもはるかに優れています。
論文 参考訳(メタデータ) (2025-02-24T05:56:47Z) - Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.084974125007165]
本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。
Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。
Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-11-07T06:36:19Z) - AgentGym: Evolving Large Language Model-based Agents across Diverse Environments [116.97648507802926]
大規模言語モデル(LLM)はそのようなエージェントを構築するための有望な基盤と考えられている。
我々は、自己進化能力を備えた一般機能 LLM ベースのエージェントを構築するための第一歩を踏み出す。
我々はAgentGymを提案する。AgentGymは、幅広い、リアルタイム、ユニフォーマット、並行エージェント探索のための様々な環境とタスクを特徴とする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-06T15:15:41Z) - Agents meet OKR: An Object and Key Results Driven Agent System with
Hierarchical Self-Collaboration and Self-Evaluation [25.308341461293857]
OKR-Agentは、タスク解決におけるLarge Language Models(LLM)の機能を強化するように設計されている。
我々のフレームワークには、階層オブジェクトとキー結果の生成とマルチレベル評価という、2つの新しいモジュールが含まれています。
論文 参考訳(メタデータ) (2023-11-28T06:16:30Z) - Ghost in the Minecraft: Generally Capable Agents for Open-World
Environments via Large Language Models with Text-based Knowledge and Memory [97.87093169454431]
Ghost in the Minecraft (GITM) は、LLM(Large Language Models)とテキストベースの知識と記憶を統合する新しいフレームワークである。
我々は、構造化されたアクションのセットを開発し、LSMを活用してエージェントが実行するアクションプランを生成する。
LLMをベースとしたエージェントは、従来の手法を著しく上回り、成功率+47.5%という顕著な改善を達成している。
論文 参考訳(メタデータ) (2023-05-25T17:59:49Z) - Learning General World Models in a Handful of Reward-Free Deployments [53.06205037827802]
汎用エージェントの構築は、深層強化学習(RL)における大きな課題である
本稿では,新しい環境下での自己監督型探査手法であるCASCADEについて紹介する。
我々は,CASCADEが多様なタスク非依存のデータセットを収集し,ゼロショットから新規で目に見えない下流タスクへのエージェント学習を行うことを示す。
論文 参考訳(メタデータ) (2022-10-23T12:38:03Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。