論文の概要: CrafterDojo: A Suite of Foundation Models for Building Open-Ended Embodied Agents in Crafter
- arxiv url: http://arxiv.org/abs/2508.13530v1
- Date: Tue, 19 Aug 2025 05:43:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.808066
- Title: CrafterDojo: A Suite of Foundation Models for Building Open-Ended Embodied Agents in Crafter
- Title(参考訳): CrafterDojo: クラフトでオープンにエンベッドされたエージェントを構築するための基礎モデルスイート
- Authors: Junyeong Park, Hyeonseo Cho, Sungjin Ahn,
- Abstract要約: Minecraftはリッチな複雑さとインターネット規模のデータを提供するが、速度とエンジニアリングのオーバーヘッドが遅いため、高速なプロトタイピングには適さない。
Crafterは、Minecraftの重要な課題を維持する軽量な代替手段を提供するが、その用途は狭いタスクに限定されている。
CrafterDojoは、Crafter環境を軽量でプロトタイピングに親しみやすい、Minecraftライクなテストベッドとしてアンロックする基盤モデルとツールのスイートです。
- 参考スコア(独自算出の注目度): 14.859398858994302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing general-purpose embodied agents is a core challenge in AI. Minecraft provides rich complexity and internet-scale data, but its slow speed and engineering overhead make it unsuitable for rapid prototyping. Crafter offers a lightweight alternative that retains key challenges from Minecraft, yet its use has remained limited to narrow tasks due to the absence of foundation models that have driven progress in the Minecraft setting. In this paper, we present CrafterDojo, a suite of foundation models and tools that unlock the Crafter environment as a lightweight, prototyping-friendly, and Minecraft-like testbed for general-purpose embodied agent research. CrafterDojo addresses this by introducing CrafterVPT, CrafterCLIP, and CrafterSteve-1 for behavior priors, vision-language grounding, and instruction following, respectively. In addition, we provide toolkits for generating behavior and caption datasets (CrafterPlay and CrafterCaption), reference agent implementations, benchmark evaluations, and a complete open-source codebase.
- Abstract(参考訳): 汎用的なエンボディエージェントの開発は、AIの中核的な課題である。
Minecraftはリッチな複雑さとインターネット規模のデータを提供するが、速度とエンジニアリングのオーバーヘッドが遅いため、高速なプロトタイピングには適さない。
Crafterは、Minecraftの重要な課題を維持する軽量な代替手段を提供するが、Minecraftの設定が進歩した基礎モデルがないため、その用途は狭いタスクに限られている。
本稿では,Crafterの環境を軽量でプロトタイピングに親しみやすく,Minecraftライクなテストベッドとして,汎用的なエージェント研究のための基盤モデルとツールのスイートであるCrafterDojoを紹介する。
CrafterDojoは、振る舞いの優先順位、視覚言語による接地、指示に従うためのCrafterVPT、CrafterCLIP、CrafterSteve-1を導入することで、この問題に対処する。
さらに、振る舞いとキャプションデータセット(CrafterPlayとCrafterCaption)を生成するツールキット、参照エージェントの実装、ベンチマーク評価、完全なオープンソースコードベースを提供する。
関連論文リスト
- Optimus-3: Towards Generalist Multimodal Minecraft Agents with Scalable Task Experts [54.21319853862452]
Minecraftの汎用エージェントOptimus-3を提案する。
エージェント開発のためのスケーラブルで高品質なトレーニングデータを提供するための知識強化型データ生成パイプラインを提案する。
視覚的多様性に対するエージェントの推論能力を高めるために,マルチモーダル推論強化学習手法を開発した。
論文 参考訳(メタデータ) (2025-06-12T05:29:40Z) - MineStudio: A Streamlined Package for Minecraft AI Agent Development [12.327116914644627]
本稿では,Minecraftにおける自律エージェント開発を効率化するオープンソースソフトウェアパッケージであるMineStudioについて述べる。
MineStudioは,シミュレータ,データ,モデル,オフライン事前トレーニング,オンラインファインチューニング,推論,ベンチマークという,7つの重要なエンジニアリングコンポーネントを総合的に統合した初めての企業だ。
包括的なドキュメンテーションとチュートリアルを伴って、ユーザフレンドリなAPI設計を提供します。
論文 参考訳(メタデータ) (2024-12-24T09:01:43Z) - Craftax: A Lightning-Fast Benchmark for Open-Ended Reinforcement Learning [4.067733179628694]
Craftaxは、JAXでCrafterをベースとして書き直したもので、Pythonネイティブのオリジナルよりも最大250倍高速である。
10億の環境相互作用を使ったPPOの実行は、1つのGPUだけで1時間以内で終了する。
本研究では,グローバル・エピソード探索を含む既存の手法と,教師なし環境設計がベンチマークで実質的な進歩を損なうことを示す。
論文 参考訳(メタデータ) (2024-02-26T18:19:07Z) - Auto MC-Reward: Automated Dense Reward Design with Large Language Models for Minecraft [88.80684763462384]
本稿では,Large Language Models (LLMs) を利用して高密度報酬関数を自動設計する,Auto MC-Rewardという高度な学習システムを提案する。
実験では、Minecraftの複雑なタスクにおいて、エージェントの成功率と学習効率が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2023-12-14T18:58:12Z) - Ghost in the Minecraft: Generally Capable Agents for Open-World
Environments via Large Language Models with Text-based Knowledge and Memory [97.87093169454431]
Ghost in the Minecraft (GITM) は、LLM(Large Language Models)とテキストベースの知識と記憶を統合する新しいフレームワークである。
我々は、構造化されたアクションのセットを開発し、LSMを活用してエージェントが実行するアクションプランを生成する。
LLMをベースとしたエージェントは、従来の手法を著しく上回り、成功率+47.5%という顕著な改善を達成している。
論文 参考訳(メタデータ) (2023-05-25T17:59:49Z) - Learning to Generalize with Object-centric Agents in the Open World
Survival Game Crafter [72.80855376702746]
強化学習エージェントは、訓練経験以上の一般化をしなければならない。
エージェントの一般化能力を評価するのに適した,新しい環境を提案する。
現在のエージェントは一般化に苦慮しており、強力なベースラインよりも優れた新しいオブジェクト中心エージェントを導入している。
論文 参考訳(メタデータ) (2022-08-05T20:05:46Z) - MineDojo: Building Open-Ended Embodied Agents with Internet-Scale
Knowledge [70.47759528596711]
私たちは、人気のMinecraftゲーム上に構築された新しいフレームワークであるMineDojoを紹介します。
本稿では,学習報酬関数として,大規模な事前学習ビデオ言語モデルを活用する新しいエージェント学習アルゴリズムを提案する。
我々のエージェントは、手動で設計した密なシェーピング報酬なしで、自由形式の言語で指定された様々なオープンエンドタスクを解くことができる。
論文 参考訳(メタデータ) (2022-06-17T15:53:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。