論文の概要: RIO: Flexible Real-Time Robot I/O for Cross-Embodiment Robot Learning
- arxiv url: http://arxiv.org/abs/2605.11564v1
- Date: Tue, 12 May 2026 05:49:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.609364
- Title: RIO: Flexible Real-Time Robot I/O for Cross-Embodiment Robot Learning
- Title(参考訳): RIO: クロスプラットフォームロボット学習のためのフレキシブルリアルタイムロボットI/O
- Authors: Pablo Ortega-Kral, Eliot Xing, Arthur Bucker, Vernon Luk, Junseo Kim, Owen Kwon, Angchen Xie, Nikhil Sobanbabu, Yifu Yuan, Megan Lee, Deepam Ameria, Bhaswanth Ayapilla, Jaycie Bussell, Guanya Shi, Jonathan Francis, Jean Oh,
- Abstract要約: ロボット制御のための柔軟で軽量なコンポーネントを提供するオープンソースのPythonフレームワークであるROO(Robot I/O)を紹介する。
3つの形態(シングルアーム、バイマニュアル、ヒューマノイド)と、グリップとカメラの異なる4つのハードウェアプラットフォームにまたがるVLAデプロイメントのRIOを検証する。
我々は、ピック・アンド・プレイス、折り畳み、ボウルスクラブといった家庭用のタスクに、$_0.5$とGR00Tを含む最先端のVLAを微調整する。
- 参考スコア(独自算出の注目度): 19.36610432610357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent efforts to collect multi-task, multi-embodiment datasets, to design recipes for training Vision-Language-Action models (VLAs), and to showcase these models on different robot platforms, generalist cross-embodiment robot capabilities remains a largely elusive ideal. Progress is limited by fragmented infrastructure: most robot code is highly specific to the exact setup the user decided on, which adds major overhead when attempting to reuse, recycle, or share artifacts between users. We present RIO (Robot I/O), an open source Python framework that provides flexible, lightweight components for robot control, teleoperation, data formatting, sensor configuration, and policy deployment across diverse hardware platforms and morphologies. RIO provides abstractions that enable users to make any choice and to switch between them, with minimal reconfiguration effort. We validate RIO on VLA deployment workflows across three morphologies (single-arm, bimanual, humanoid) and four hardware platforms with varying grippers and cameras. Using teleoperated data collected with RIO, we fine-tune state-of-the-art VLAs including $π_{0.5}$ and GR00T on household tasks such as pick-and-place, folding, and bowl scrubbing. By open sourcing all our efforts, we hope the community can accelerate their pace of robot learning on real-world robot hardware. Additional details at: https://robot-i-o.github.io
- Abstract(参考訳): 近年のマルチタスク、マルチ・エボディメント・データセットの収集、ビジョン・ランゲージ・アクション・モデル(VLA)のトレーニングのためのレシピの設計、そしてこれらのモデルを異なるロボットプラットフォームで披露する努力にもかかわらず、汎用的なクロス・エボディメント・ロボットの能力は依然として大半が理想的である。
ほとんどのロボットコードは、ユーザが決めた正確なセットアップに非常に依存しており、ユーザ間でアーティファクトを再利用、リサイクル、共有しようとする場合、大きなオーバーヘッドが生じる。
RIO(Robot I/O)は,ロボット制御,遠隔操作,データフォーマッティング,センサ構成,さまざまなハードウェアプラットフォームと形態をまたいだポリシデプロイメントのための,フレキシブルで軽量なコンポーネントを提供する,オープンソースのPythonフレームワークである。
RIOは、ユーザが任意の選択をし、それらを切り替えることを可能にする抽象化を、最小限の再構成作業で提供する。
3つの形態(シングルアーム、バイマニュアル、ヒューマノイド)と、グリップとカメラの異なる4つのハードウェアプラットフォームにわたるVLAデプロイメントワークフロー上でのRIOを検証する。
RIOを用いて収集した遠隔操作データを用いて, ピック・アンド・プレイス, 折り畳み, ボウルスクラッピングなどの家庭用タスクにおいて, π_{0.5}$およびGR00Tを含む最先端のVLAを微調整する。
すべての努力をオープンソース化することで、コミュニティが現実世界のロボットハードウェア上でロボット学習のペースを加速できることを願っています。
詳細は、https://robot-i-o.github.io
関連論文リスト
- RDT2: Exploring the Scaling Limit of UMI Data Towards Zero-Shot Cross-Embodiment Generalization [31.40401674436269]
RDT2は、7BパラメータVLM上に構築されたロボット基盤モデルであり、オープン語彙タスクのための新しい実施形態のゼロショット展開を可能にする。
私たちは、さまざまな家族で1万時間以上のデモを行い、拡張されたエンボディメントに依存しないユニバーサルマニピュレーションインタフェース(UMI)を使って、オープンソースのロボットデータセットの1つを収集しました。
提案手法では,Residual Vector Quantization (RVQ), flow-matching, およびリアルタイム推論のための蒸留により, 個別の言語知識を連続的な制御と整合させる新しい3段階学習法を用いる。
論文 参考訳(メタデータ) (2026-02-03T09:38:23Z) - LEO-RobotAgent: A General-purpose Robotic Agent for Language-driven Embodied Operator [1.5566524830295307]
ロボットのための汎用言語駆動型インテリジェントエージェントフレームワークLEO-RobotAgentを提案する。
このフレームワークは強力な一般化、堅牢性、効率性を備えている。
実験では、このフレームワークが主流のロボットプラットフォームに容易に適応できることが確認されている。
論文 参考訳(メタデータ) (2025-12-11T12:58:36Z) - Dexterity from Smart Lenses: Multi-Fingered Robot Manipulation with In-the-Wild Human Demonstrations [52.29884993824894]
自然環境で日々のタスクを行う人間から、マルチフィンガーロボットポリシーを学ぶことは、ロボットコミュニティにとって長年の大きな目標だった。
AINAは、Aria Gen 2メガネを使用して、どこでも、どこでも、あらゆる環境で収集されたデータから、マルチフィンガーポリシーを学ぶことができる。
論文 参考訳(メタデータ) (2025-11-20T18:59:02Z) - Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.166320712764465]
VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。
従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。
我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文 参考訳(メタデータ) (2025-09-18T13:12:16Z) - The One RING: a Robotic Indoor Navigation Generalist [58.30694487843546]
RING (Robotic Indoor Navigation Generalist) は、あらゆる移動ロボットを効果的な屋内セマンティックナビゲータに変えるための具体的方針である。
完全にシミュレーションで訓練されたRingは、ロボットによる大規模なランダム化を利用して、多くの現実世界のプラットフォームに堅牢な一般化を可能にする。
論文 参考訳(メタデータ) (2024-12-18T23:15:41Z) - Robot Utility Models: General Policies for Zero-Shot Deployment in New Environments [26.66666135624716]
ゼロショットロボットポリシーのトレーニングとデプロイのためのフレームワークであるロボットユーティリティモデル(RUM)を提案する。
RUMは微調整なしで新しい環境に一般化できる。
キャビネットドアのオープン、引き出しのオープン、ナプキンのピックアップ、紙袋のピックアップ、転倒物の再配向の5つのユーティリティモデルを訓練する。
論文 参考訳(メタデータ) (2024-09-09T17:59:50Z) - Octo: An Open-Source Generalist Robot Policy [88.14295917143188]
ここでは,Open X-Embodimentデータセットから800kトラジェクトリをトレーニングした,大規模なトランスフォーマーベースのポリシであるOctoを紹介する。
標準のGPUでは数時間以内に、新しいセンサー入力とアクションスペースを備えたロボットセットアップに効果的にカスタマイズできる。
また,アーキテクチャからトレーニングデータに至るまで,Octoモデルの設計決定の詳細な説明を行い,汎用ロボットモデルの構築に関する今後の研究を指導する。
論文 参考訳(メタデータ) (2024-05-20T17:57:01Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Polybot: Training One Policy Across Robots While Embracing Variability [70.74462430582163]
複数のロボットプラットフォームにデプロイするための単一のポリシーをトレーニングするための重要な設計決定セットを提案する。
われわれのフレームワークは、まず、手首カメラを利用して、我々のポリシーの観察空間と行動空間を具体化して調整する。
6つのタスクと3つのロボットにまたがる60時間以上のデータセットを用いて,関節の形状や大きさの異なるデータセットの評価を行った。
論文 参考訳(メタデータ) (2023-07-07T17:21:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。