論文の概要: OpenEAI-Platform: An Open-source Embodied Artificial Intelligence Hardware-Software Unified Platform
- arxiv url: http://arxiv.org/abs/2606.03392v1
- Date: Tue, 02 Jun 2026 09:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.909594
- Title: OpenEAI-Platform: An Open-source Embodied Artificial Intelligence Hardware-Software Unified Platform
- Title(参考訳): OpenEAI-Platform: オープンソースの人工知能ハードウェアソフトウェア統一プラットフォーム
- Authors: Jinyuan Zhang, Luoyi Fan, Leiyu Wang, Yeqiang Wang, Yicheng Zhu, Cewu Lu, Nanyang Ye,
- Abstract要約: OpenEAI-Platformは,安価な6+1自由度ロボットアーム(OpenEAI-Arm)と再現可能なVLAモデル(OpenEAI-VLA)を統合した,完全なオープンソースプラットフォームである。
OpenEAI-Armは、低コストでオープンソースの機械設計と高精度な制御方法を提供する。
OpenEAI-VLAはQwen3-VL-4B上に構築されており、Diffusion Transformerアクションヘッドを使用しており、オープンソースのロボットとマルチモーダルデータセットのみを用いて2段階でトレーニングされている。
- 参考スコア(独自算出の注目度): 42.32982807493291
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied AI in the real world requires both accurate hardware and robust vision-language-action (VLA) policies. We present OpenEAI-Platform, a fully open-source platform that integrates a low-cost 6+1 degree-of-freedom (dof) robotic arm (OpenEAI-Arm) and a reproducible VLA model (OpenEAI-VLA). OpenEAI-Arm provides open-source mechanical designs for low manufacturing cost and compliant control methods for higher accuracy. OpenEAI-VLA builds on Qwen3-VL-4B and uses a Diffusion Transformer action head, and is trained in two stages with only open-source robot and multimodal datasets. Across four real-world manipulation tasks, OpenEAI-Arm outperforms two commercial 6+1-dof arms under the same policy, and OpenEAI-VLA achieves success rates comparable to the large-scale pretrained pi0 baseline with only limited pretraining data. We will release the full hardware designs, drivers, models, and training/data pipelines to support reproducible research and scalable data collection. Our codes, layouts, and models will be released after the paper is accepted.
- Abstract(参考訳): 現実世界の身体的AIは、正確なハードウェアと堅牢な視覚言語アクション(VLA)ポリシーの両方を必要とする。
我々は,低コストの6+1自由度ロボットアーム(OpenEAI-Arm)と再現可能なVLAモデル(OpenEAI-VLA)を統合した,完全なオープンソースプラットフォームであるOpenEAI-Platformを提案する。
OpenEAI-Armは、低コストでオープンソースの機械設計と高精度な制御方法を提供する。
OpenEAI-VLAはQwen3-VL-4B上に構築され、Diffusion Transformerアクションヘッドを使用し、オープンソースのロボットとマルチモーダルデータセットのみを用いて2段階のトレーニングを行っている。
実際の4つの操作タスクの中で、OpenEAI-Armは同じ方針の下で2つの商用6+1-dofアームを上回り、OpenEAI-VLAは大規模な事前訓練されたpi0ベースラインに匹敵する成功率を達成した。
再現可能なリサーチとスケーラブルなデータ収集をサポートするために、ハードウェア設計、ドライバ、モデル、トレーニング/データパイプラインをすべてリリースします。
私たちのコード、レイアウト、モデルは、論文が受け入れられた後にリリースされます。
関連論文リスト
- StarVLA-$α$: Reducing Complexity in Vision-Language-Action Systems [89.12403322299963]
StarVLA-$は、制御条件下でのVLA設計選択を研究するための単純だが強力なベースラインである。
我々は,アクションモデリング戦略,ロボット固有の事前訓練,インターフェースエンジニアリングなど,いくつかの重要な設計軸を再評価する。
我々の1つのジェネラリストモデルは、公開現実のRoboChallengeベンチマークで$_0.5$を20%上回ります。
論文 参考訳(メタデータ) (2026-04-13T17:30:01Z) - Infrastructure First: Enabling Embodied AI for Science in the Global South [16.251692668102784]
EAI4S(Embodied AI for Science)は、知覚、推論、ロボット動作を統一することで、研究所にインテリジェンスをもたらす。
この記事では、EAI4Sに対するインフラ優先のアプローチについて論じ、大規模なインテリジェンスを展開するための実践的な要件を概説する。
論文 参考訳(メタデータ) (2026-04-08T06:39:25Z) - Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.166320712764465]
VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。
従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。
我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文 参考訳(メタデータ) (2025-09-18T13:12:16Z) - OpenVLA: An Open-Source Vision-Language-Action Model [131.74098076670103]
我々は、970kの現実世界のロボットデモの多様なコレクションに基づいて訓練されたオープンソースのVLAであるOpenVLAを紹介した。
OpenVLAは汎用的な操作の強力な結果を示し、RT-2-X (55B) のようなクローズドモデルよりも16.5%高い絶対的なタスク成功率を示した。
モデルチェックポイント、微調整ノートブック、そしてOpen X-Embodimentデータセット上で大規模にVLAをトレーニングするためのビルトインサポートを備えたPyTorchをリリースしています。
論文 参考訳(メタデータ) (2024-06-13T15:46:55Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。