論文の概要: MuJoCoUni:Persistent Batched Runtime Primitives for MuJoCo
- arxiv url: http://arxiv.org/abs/2605.24922v1
- Date: Sun, 24 May 2026 07:57:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.512201
- Title: MuJoCoUni:Persistent Batched Runtime Primitives for MuJoCo
- Title(参考訳): MuJoCoUni: MuJoCo の永続バッチ実行プリミティブ
- Authors: Yufei Jia, Junzhe Wu,
- Abstract要約: MuJoCoUniはステートフル環境実行のためのランタイムプリミティブを提供する。
BatchEnvPoolは、環境ごとのmjModelコピー、スレッドごとのmjDataワーカー、内部スレッドプールを所有するC++/pybind11エグゼキュータである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present MuJoCoUni, a downstream MuJoCo distribution for online robot learning and batched physics evaluation. Alongside the open-loop batched trajectory generation already provided by upstream mujoco.rollout, MuJoCoUni supplies runtime primitives for stateful environment execution. The target workloads need high-throughput parallel execution while retaining upstream CPU MuJoCo semantics for models, sensors, contact, and constraints. Its core object, BatchEnvPool, is a C++/pybind11 executor that owns per-environment mjModel copies, per-thread mjData workers, and an internal thread pool. It provides final-state-only short stepping, sparse reset, reset-lifecycle domain randomization, batched sensor forward evaluation without advancing dynamics, and batched Jacobian and height-field queries. The implementation is confined to the Python binding layer; MuJoCo's solver, contact model, integrator, and core source tree retain upstream semantics. This report describes the BatchEnvPool API, implementation boundary, relationship to rollout, and the validation and benchmark scripts shipped with the open-source mujoco-uni package, which is installed with \texttt{pip install mujoco-uni}.
- Abstract(参考訳): オンラインロボット学習とバッチ物理評価のための,下流の MuJoCo ディストリビューション MuJoCoUni を提案する。
上流の mujoco.rollout が提供するオープンループバッチ軌道生成に加えて、MuJoCoUni はステートフルな環境実行のためのランタイムプリミティブを提供する。
ターゲットのワークロードは、モデル、センサー、コンタクト、制約のための上流CPU MuJoCoセマンティクスを維持しながら、高スループットの並列実行を必要とする。
そのコアオブジェクトであるBatchEnvPoolは、環境ごとのmjModelコピー、スレッドごとのmjDataワーカー、内部スレッドプールを所有するC++/pybind11エグゼキュータである。
最終状態のみのショートステップ、スパースリセット、リセットライフサイクルドメインランダム化、動的に進まないバッチ化されたセンサフォワード評価、バッチ化されたヤコビアンおよびハイトフィールドクエリを提供する。
実装はPythonバインディング層に限られており、MuJoCoのソルバ、コンタクトモデル、インテグレータ、コアソースツリーは上流のセマンティクスを保持する。
この記事では、BatchEnvPool API、実装バウンダリ、ロールアウトとの関係、オープンソースのmujoco-uniパッケージで出荷されるバリデーションとベンチマークスクリプトについて説明する。
関連論文リスト
- ChipMATE: Multi-Agent Training via Reinforcement Learning for Enhanced RTL Generation [55.947962672433675]
ChipMATEは、RTL生成のための最初の自己学習型マルチエージェントフレームワークである。
ChipMATEは産業的な実践に触発され、VerilogエージェントとPythonのリファレンスモデルエージェントをペアにし、相互に出力を検証する。
ChipMATEは、VerilogEval V2で75.0%と80.1%パス@1を4Bと9Bベースモデルで達成している。
論文 参考訳(メタデータ) (2026-05-13T01:04:21Z) - Automatic Generation of High-Performance RL Environments [13.796920626646964]
複雑な強化学習環境を高性能な実装に変換するには、これまで何ヶ月もの専門技術が必要だった。
計算コスト10ドルで意味論的に等価な高性能環境を創出する再利用可能なレシピを提案する。
論文 参考訳(メタデータ) (2026-03-12T16:45:47Z) - mjlab: A Lightweight Framework for GPU-Accelerated Robot Learning [44.50717567472821]
mjlabは、GPU加速シミュレーションと構成可能な環境を組み合わせた、ロボット学習のためのフレームワークである。
mjlabにはベロシティトラッキング、モーション模倣、操作タスクのリファレンス実装が付属している。
論文 参考訳(メタデータ) (2026-01-29T18:11:26Z) - VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents [42.56489784841984]
実装の変更が生成され、エージェントが提案する差分として適用される。
アーキテクチャを説明し、システムの生成と検証に使用するワークフローを要約し、アーティファクトを評価する。
論文 参考訳(メタデータ) (2026-01-21T19:29:00Z) - EVM-QuestBench: An Execution-Grounded Benchmark for Natural-Language Transaction Code Generation [9.472124187479915]
オンチェーントランザクションのシナリオでは、小さなエラーでさえ、ユーザにとって不可逆的な損失を引き起こす可能性がある。
EVM-QuestBenchは自然言語トランザクションスクリプト生成のための実行基盤ベンチマークである。
単一動作精度と複数ステップのワークフロー完了の間に永続的な非対称性を示す分割スコアを用いて,20のモデルを評価し,大きな性能ギャップを求める。
論文 参考訳(メタデータ) (2026-01-10T13:25:27Z) - Counting Without Running: Evaluating LLMs' Reasoning About Code Complexity [2.7389338551082605]
性能ボトルネックを予測するため,LLM(Large Language Models)のベンチマークを開発した。
FLOPBenchは577カーネルの単精度と倍精度のFLOP数を予測する。
われわれはFLOPBenchをLLMツールの開発に焦点をあてたテストベッドとして位置づけた。
論文 参考訳(メタデータ) (2025-12-04T01:03:20Z) - Cooperative Pseudo Labeling for Unsupervised Federated Classification [62.9387841396335]
Unsupervised Federated Learning (UFL)は、データを共有したりラベル情報にアクセスしたりすることなく、分散クライアント間でグローバルモデルを協調的にトレーニングすることを目的としている。
我々は、新しい方法、 underlinetextbfFederated underlinetextbfCooperative underlinetextbfPseudo underlinetextbfLabeling (textbfFedCoPL)を提案する。
特に、一般的な画像特徴を含む視覚的プロンプトをサーバに集約し、パーソナライズされた知識をコードするテキストプロンプトをローカルに保持する。
論文 参考訳(メタデータ) (2025-10-11T08:18:26Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - EnvBench: A Benchmark for Automated Environment Setup [76.02998475135824]
大規模言語モデルにより、研究者はソフトウェア工学領域における実用的なリポジトリレベルのタスクに集中できるようになった。
環境設定に関する既存の研究は革新的なエージェント戦略を導入しているが、その評価は小さなデータセットに基づいていることが多い。
このギャップに対処するため、包括的環境設定ベンチマークEnvBenchを紹介します。
論文 参考訳(メタデータ) (2025-03-18T17:19:12Z) - EnvPool: A Highly Parallel Reinforcement Learning Environment Execution
Engine [69.47822647770542]
並列環境の実行はシステム全体の最も遅い部分であるが、ほとんど注意を払わない。
RL環境の並列化設計により,RL環境シミュレーションの高速化を実現した。
ハイエンドマシンでは、Atari環境での環境実行で毎秒100万フレーム、MuJoCo環境では毎秒300万フレームを達成する。
論文 参考訳(メタデータ) (2022-06-21T17:36:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。