論文の概要: ManipulationNet: An Infrastructure for Benchmarking Real-World Robot Manipulation with Physical Skill Challenges and Embodied Multimodal Reasoning
- arxiv url: http://arxiv.org/abs/2603.04363v1
- Date: Wed, 04 Mar 2026 18:29:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.905339
- Title: ManipulationNet: An Infrastructure for Benchmarking Real-World Robot Manipulation with Physical Skill Challenges and Embodied Multimodal Reasoning
- Title(参考訳): ManipulationNet: 物理的なスキルチャレンジとマルチモーダル推論による実世界のロボットマニピュレーションのベンチマークのための基盤
- Authors: Yiting Chen, Kenneth Kimble, Edward H. Adelson, Tamim Asfour, Podshara Chanrungmaneekul, Sachin Chitta, Yash Chitambar, Ziyang Chen, Ken Goldberg, Danica Kragic, Hui Li, Xiang Li, Yunzhu Li, Aaron Prather, Nancy Pollard, Maximo A. Roa-Garzon, Robert Seney, Shuo Sha, Shihefeng Wang, Yu Xiang, Kaifeng Zhang, Yuke Zhu, Kaiyu Hang,
- Abstract要約: 有害な操作により、ロボットは物理的世界を意図的に変化させ、パッシブな観察者から非構造環境のアクティブなエージェントに変えることができる。
ハードウェア、知覚、制御、学習の数十年にわたる進歩にもかかわらず、一般的な操作システムへの進歩は依然として断片化されている。
ロボット操作のための実世界のベンチマークタスクをホストするグローバルインフラストラクチャであるManipulationNetを紹介した。
- 参考スコア(独自算出の注目度): 61.35327888597012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dexterous manipulation enables robots to purposefully alter the physical world, transforming them from passive observers into active agents in unstructured environments. This capability is the cornerstone of physical artificial intelligence. Despite decades of advances in hardware, perception, control, and learning, progress toward general manipulation systems remains fragmented due to the absence of widely adopted standard benchmarks. The central challenge lies in reconciling the variability of the real world with the reproducibility and authenticity required for rigorous scientific evaluation. To address this, we introduce ManipulationNet, a global infrastructure that hosts real-world benchmark tasks for robotic manipulation. ManipulationNet delivers reproducible task setups through standardized hardware kits, and enables distributed performance evaluation via a unified software client that delivers real-time task instructions and collects benchmarking results. As a persistent and scalable infrastructure, ManipulationNet organizes benchmark tasks into two complementary tracks: 1) the Physical Skills Track, which evaluates low-level physical interaction skills, and 2) the Embodied Reasoning Track, which tests high-level reasoning and multimodal grounding abilities. This design fosters the systematic growth of an interconnected network of real-world abilities and skills, paving the path toward general robotic manipulation. By enabling comparable manipulation research in the real world at scale, this infrastructure establishes a sustainable foundation for measuring long-term scientific progress and identifying capabilities ready for real-world deployment.
- Abstract(参考訳): 有害な操作により、ロボットは物理的世界を意図的に変化させ、パッシブな観察者から非構造環境のアクティブなエージェントに変えることができる。
この能力は、物理的な人工知能の基盤となっている。
ハードウェア、知覚、制御、学習の数十年にわたる進歩にもかかわらず、広く採用されている標準ベンチマークが欠如しているため、一般的な操作システムへの進歩は断片化されている。
中心的な課題は、厳密な科学的評価に必要な再現性と認証と、現実世界の多様性を調和させることである。
この問題を解決するために,ロボット操作のための実世界のベンチマークタスクをホストするグローバルインフラストラクチャであるManipulationNetを紹介した。
ManipulationNetは、標準化されたハードウェアキットを通じて再現可能なタスク設定を提供し、リアルタイムタスク命令を配信し、ベンチマーク結果を収集する統合ソフトウェアクライアントを介して分散パフォーマンス評価を可能にする。
永続的でスケーラブルなインフラストラクチャとして、ManipulationNetは、ベンチマークタスクを2つの補完的なトラックにまとめている。
1)低レベルの身体的相互作用能力を評価する身体スキルトラック、及び
2)高レベル推論とマルチモーダルグラウンド機能をテストするEmbodied Reasoning Track。
この設計は、現実世界の能力とスキルの相互接続ネットワークの体系的な成長を促進し、一般的なロボット操作への道を歩む。
このインフラは、現実世界の大規模に匹敵する操作研究を可能にすることで、長期的な科学的進歩を計測し、現実世界の展開に備えた能力を特定するための持続可能な基盤を確立します。
関連論文リスト
- Building Explicit World Model for Zero-Shot Open-World Object Manipulation [30.004607772330473]
オープンワールド操作のための明示的世界モデルベースのフレームワークを提案する。
このフレームワークは、オープンセットの認識、デジタル双対再構築、インタラクション戦略のサンプリングと評価を統合している。
提案するフレームワークは,タスク固有の動作デモを伴わずに,複数のオープンセット操作タスクを実行できる。
論文 参考訳(メタデータ) (2026-03-14T08:13:32Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - RobotArena $\infty$: Scalable Robot Benchmarking via Real-to-Sim Translation [47.79800816696372]
操作ポリシーの現実的なテストは、大規模に労働集約的で、再現が難しい。
既存のシミュレーションベンチマークも同様に制限されており、同じ合成ドメイン内でポリシーをトレーニングおよびテストしている。
本稿では,VLA評価を大規模にシミュレーションした拡張環境に移行することで,これらの課題を克服する新しいベンチマークフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-27T17:41:38Z) - Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8381970762877]
VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-09T09:08:33Z) - SkillBlender: Towards Versatile Humanoid Whole-Body Loco-Manipulation via Skill Blending [79.83865372778273]
SkillBlenderは、多目的なヒューマノイドロコ操作のための新しい階層的強化学習フレームワークである。
SkillBlenderは、まずゴール条件付きタスク非依存のプリミティブスキルを事前訓練し、その後、これらのスキルを動的にブレンドして複雑なロコ操作タスクを達成する。
また,3つのエボディメント,4つのプリミティブスキル,8つの難解なロコ操作タスクを含む並列的,クロスエボディメント,多種多様なシミュレーションベンチマークであるSkillBenchを紹介した。
論文 参考訳(メタデータ) (2025-06-11T03:24:26Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - Integrated Benchmarking and Design for Reproducible and Accessible
Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。
このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。
本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文 参考訳(メタデータ) (2020-09-09T15:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。