Fugu-MT 論文翻訳(概要): GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS

論文の概要: GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS

arxiv url: http://arxiv.org/abs/2408.01584v1
Date: Fri, 2 Aug 2024 21:37:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-06 19:30:18.813978
Title: GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS
Title（参考訳）: GPUDrive:100万FPSでデータ駆動マルチエージェント駆動シミュレーション
Authors: Saman Kazemkhani, Aarav Pandya, Daphne Cornelisse, Brennan Shacklett, Eugene Vinitsky,
Abstract要約: GPUDriveはMadrona Game Engine上に構築されたGPUアクセラレーションされたマルチエージェントシミュレータである。 GPUDriveを使うことで、多くの場面で強化学習エージェントを効果的に訓練できることが示されています。
参考スコア（独自算出の注目度）: 4.172988187048097
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-agent learning algorithms have been successful at generating superhuman planning in a wide variety of games but have had little impact on the design of deployed multi-agent planners. A key bottleneck in applying these techniques to multi-agent planning is that they require billions of steps of experience. To enable the study of multi-agent planning at this scale, we present GPUDrive, a GPU-accelerated, multi-agent simulator built on top of the Madrona Game Engine that can generate over a million steps of experience per second. Observation, reward, and dynamics functions are written directly in C++, allowing users to define complex, heterogeneous agent behaviors that are lowered to high-performance CUDA. We show that using GPUDrive we are able to effectively train reinforcement learning agents over many scenes in the Waymo Motion dataset, yielding highly effective goal-reaching agents in minutes for individual scenes and generally capable agents in a few hours. We ship these trained agents as part of the code base at https://github.com/Emerge-Lab/gpudrive.
Abstract（参考訳）: マルチエージェント学習アルゴリズムは多種多様なゲームでスーパーヒューマンプランニングを生成することに成功したが、デプロイされたマルチエージェントプランナーの設計にはほとんど影響を与えていない。これらのテクニックをマルチエージェント計画に適用する上で重要なボトルネックは、何十億もの経験ステップを必要とすることだ。このスケールでのマルチエージェント計画の研究を可能にするために,Madrona Game Engine上に構築されたGPUアクセラレーションによるマルチエージェントシミュレータであるGPUDriveを紹介した。観察、報酬、動的関数はC++で直接書かれており、ユーザーは高性能なCUDAに格下げされる複雑で異質なエージェントの振る舞いを定義できる。 GPUDriveを使用することで、Waymo Motionデータセットの多くのシーンで強化学習エージェントを効果的にトレーニングすることができ、個々のシーンで数分で高い効率の目標達成エージェントが得られ、数時間で一般的に有能なエージェントが得られます。トレーニングされたエージェントは、https://github.com/Emerge-Lab/gpudrive.comのコードベースの一部として出荷されます。

関連論文リスト

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.01901238059261]
APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。 xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳（メタデータ） (2025-04-04T17:13:57Z)
Building reliable sim driving agents by scaling self-play [3.3378669626639423]
1つのGPUでスクラッチからトレーニングすることで、エージェントは1日以内に完全なトレーニングセットを解決します。彼らは効果的にテストシーンを見えないように一般化し、99.8%のゴール達成率と0.8%以下の衝突とオフロードインシデントを達成した。我々は、事前訓練されたエージェントをオープンソース化し、バッチ化されたマルチエージェントシミュレータと統合する。
論文参考訳（メタデータ） (2025-02-20T16:30:45Z)
WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving [54.365702251769456]
我々は、駆動シーケンス当たり平均8.4エージェントのデータセットを提示する。自律運転データセットの中で最大のエージェントと視点を提供するだけでなく、WHALESはエージェントの振る舞いを記録する。エージェントスケジューリングタスクにおいて,エゴエージェントが複数の候補エージェントの1つを選択して協調する実験を行う。
論文参考訳（メタデータ） (2024-11-20T14:12:34Z)
Very Large-Scale Multi-Agent Simulation in AgentScope [112.98986800070581]
我々は,ユーザフレンドリーなマルチエージェントプラットフォームであるAgentScopeの新機能とコンポーネントを開発した。高いスケーラビリティと高効率を実現するために,アクタをベースとした分散機構を提案する。また、多数のエージェントを便利に監視し、管理するためのWebベースのインターフェースも提供します。
論文参考訳（メタデータ） (2024-07-25T05:50:46Z)
Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。 Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文参考訳（メタデータ） (2024-07-15T17:54:37Z)
ScreenAgent: A Vision Language Model-driven Computer Control Agent [17.11085071288194]
視覚言語モデル(VLM)エージェントが実際のコンピュータ画面と対話する環境を構築する。この環境では、エージェントは、マウスとキーボードのアクションを出力することで、スクリーンショットを観察し、GUI(Graphics User Interface)を操作することができる。そこで,ScreenAgentデータセットを構築し,様々なコンピュータタスクの完了時にスクリーンショットとアクションシーケンスを収集する。
論文参考訳（メタデータ） (2024-02-09T02:33:45Z)
Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。 TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文参考訳（メタデータ） (2023-10-12T20:49:15Z)
Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。 Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文参考訳（メタデータ） (2023-10-12T17:59:58Z)
Nocturne: a scalable driving benchmark for bringing multi-agent learning one step closer to the real world [11.069445871185744]
部分観測可能性下でのマルチエージェント協調を調査するための新しい2次元駆動シミュレータである textitNocturne を導入する。 Nocturneの焦点は、コンピュータビジョンの計算オーバーヘッドや画像からの特徴抽出を伴わずに、実世界のマルチエージェント環境での推論と心の理論の研究を可能にすることである。
論文参考訳（メタデータ） (2022-06-20T16:51:44Z)
WarpDrive: Extremely Fast End-to-End Deep Multi-Agent Reinforcement Learning on a GPU [15.337470862838794]
我々は、単一のGPU上でエンドツーエンドのマルチエージェントRLを実装する、柔軟で軽量で使いやすいオープンソースのRLフレームワークであるWarpDriveを紹介します。我々の設計ではシミュレーションとエージェントを並列に実行し、GPU上に1つのシミュレーションデータストアを配置して安全に更新する。 WarpDriveは、ベンチマークTagシミュレーションにおいて、2000の環境と1000のエージェント(CPU実装と比べて少なくとも100倍高いスループット)で290万の環境ステップ/秒を生成する。
論文参考訳（メタデータ） (2021-08-31T16:59:27Z)
Megaverse: Simulating Embodied Agents at One Million Experiences per Second [75.1191260838366]
私たちは、強化学習と具体化AI研究のための新しい3DシミュレーションプラットフォームであるMegaverseを紹介します。 MegaverseはDeepMind Labより最大70倍速い。私たちはMegaverseを使って、複数の単一エージェントタスクとマルチエージェントタスクからなる新しいベンチマークを構築します。
論文参考訳（メタデータ） (2021-07-17T03:16:25Z)
Large Batch Simulation for Deep Reinforcement Learning [101.01408262583378]
我々は,視覚複雑な3次元環境における深層強化学習に基づく学習を,事前作業よりも2桁高速化する。単一のGPUマシンで1秒間に19,000フレーム以上の経験と最大72,000フレーム/秒のエンドツーエンドのトレーニング速度を実現します。バッチシミュレーションと性能最適化を組み合わせることで、1つのGPU上の複雑な3D環境において、従来の最先端システムでトレーニングされたエージェントの精度の97%から97%まで、ポイントナビゲーションエージェントをトレーニングできることを実証する。
論文参考訳（メタデータ） (2021-03-12T00:22:50Z)
MADRaS : Multi Agent Driving Simulator [15.451658979433667]
自律運転のための運動計画アルゴリズムの設計と評価に使用するオープンソースのマルチエージェント駆動シミュレータMADRaSを提案する。 MADRaSはオープンソースのカーレースシミュレータTORCS上に構築されている。
論文参考訳（メタデータ） (2020-10-02T13:38:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。