論文の概要: RoboPianist: A Benchmark for High-Dimensional Robot Control
- arxiv url: http://arxiv.org/abs/2304.04150v1
- Date: Sun, 9 Apr 2023 03:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 17:29:22.167358
- Title: RoboPianist: A Benchmark for High-Dimensional Robot Control
- Title(参考訳): RoboPianist: 高次元ロボット制御のためのベンチマーク
- Authors: Kevin Zakka, Laura Smith, Nimrod Gileadi, Taylor Howell, Xue Bin Peng,
Sumeet Singh, Yuval Tassa, Pete Florence, Andy Zeng, Pieter Abbeel
- Abstract要約: 本研究では,空間的および時間的精度,調整,計画の検証を目的とした,高次元制御のための新しいベンチマークスイートを提案する。
提案する課題は、シミュレートされた擬人化ロボットハンドを使って、手動でピアノを習得することである。
私たちはそれをRoboPianistと呼び、最初のバージョンは150種類の可変差分曲をカバーしています。
- 参考スコア(独自算出の注目度): 61.84996967689553
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a new benchmarking suite for high-dimensional control, targeted
at testing high spatial and temporal precision, coordination, and planning, all
with an underactuated system frequently making-and-breaking contacts. The
proposed challenge is mastering the piano through bi-manual dexterity, using a
pair of simulated anthropomorphic robot hands. We call it RoboPianist, and the
initial version covers a broad set of 150 variable-difficulty songs. We
investigate both model-free and model-based methods on the benchmark,
characterizing their performance envelopes. We observe that while certain
existing methods, when well-tuned, can achieve impressive levels of performance
in certain aspects, there is significant room for improvement. RoboPianist
provides a rich quantitative benchmarking environment, with human-interpretable
results, high ease of expansion by simply augmenting the repertoire with new
songs, and opportunities for further research, including in multi-task
learning, zero-shot generalization, multimodal (sound, vision, touch) learning,
and imitation. Supplementary information, including videos of our control
policies, can be found at https://kzakka.com/robopianist/
- Abstract(参考訳): 我々は,高次元制御のための新しいベンチマークスイートを導入し,空間的および時間的精度,協調性,計画性をテストする。
提案する課題は、シミュレートされた擬人化ロボットハンドを使って、手動でピアノを習得することである。
私たちはそれをRoboPianistと呼び、最初のバージョンは150種類の可変差分曲をカバーしています。
モデルフリー法とモデルベース法の両方をベンチマークで検討し,その性能を特徴付ける。
我々は、ある既存の手法が、適切に調整されると、ある面で印象的なレベルのパフォーマンスを達成できるが、改善の余地は大きいと観察する。
robopianistは、人間の解釈可能な結果、新しい曲によるレパートリーの強化による拡張の容易さ、マルチタスク学習、ゼロショット一般化、マルチモーダル(サウンド、視覚、タッチ)学習、模倣など、さらなる研究の機会を備えた、豊富な定量的ベンチマーク環境を提供する。
コントロールポリシのビデオを含む追加情報は、https://kzakka.com/robopianist/にある。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Learning Perceptual Concepts by Bootstrapping from Human Queries [41.07749131023931]
本稿では,ロボットが概念の低次元変種を学習し,それを用いて高次元空間における概念学習のためのより大きなデータセットを生成する手法を提案する。
これにより、オブジェクトのポーズやバウンディングボックスなど、トレーニング時にのみアクセス可能な意味的に意味のある特権情報の活用が可能になる。
論文 参考訳(メタデータ) (2021-11-09T16:43:46Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z) - Hyperparameters optimization for Deep Learning based emotion prediction
for Human Robot Interaction [0.2549905572365809]
インセプションモジュールをベースとした畳み込みニューラルネットワークアーキテクチャを提案する。
モデルは人型ロボットNAOにリアルタイムに実装され、モデルの堅牢性を評価する。
論文 参考訳(メタデータ) (2020-01-12T05:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。