論文の概要: Learning to Play Piano in the Real World
- arxiv url: http://arxiv.org/abs/2503.15481v1
- Date: Wed, 19 Mar 2025 17:56:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:24:27.809720
- Title: Learning to Play Piano in the Real World
- Title(参考訳): 現実世界でピアノを弾くことを学ぶ
- Authors: Yves-Simon Zeulner, Sandeep Selvaraj, Roberto Calandra,
- Abstract要約: 我々は,学習アプローチを生かした最初のピアノ演奏ロボットシステムを開発し,実世界における器用なロボットに展開する。
具体的には,Sim2Realを用いて,実世界のデキスタスロボットに学習ポリシーをデプロイする前に,強化学習を用いてシミュレーションのポリシーを訓練する。
- 参考スコア(独自算出の注目度): 3.824631943614614
- License:
- Abstract: Towards the grand challenge of achieving human-level manipulation in robots, playing piano is a compelling testbed that requires strategic, precise, and flowing movements. Over the years, several works demonstrated hand-designed controllers on real world piano playing, while other works evaluated robot learning approaches on simulated piano scenarios. In this paper, we develop the first piano playing robotic system that makes use of learning approaches while also being deployed on a real world dexterous robot. Specifically, we make use of Sim2Real to train a policy in simulation using reinforcement learning before deploying the learned policy on a real world dexterous robot. In our experiments, we thoroughly evaluate the interplay between domain randomization and the accuracy of the dynamics model used in simulation. Moreover, we evaluate the robot's performance across multiple songs with varying complexity to study the generalization of our learned policy. By providing a proof-of-concept of learning to play piano in the real world, we want to encourage the community to adopt piano playing as a compelling benchmark towards human-level manipulation. We open-source our code and show additional videos at https://lasr.org/research/learning-to-play-piano .
- Abstract(参考訳): ロボットで人間レベルの操作を実現するという大きな課題に向けて、ピアノを弾くことは、戦略的、正確、そして流れる動きを必要とする魅力的なテストベッドである。
長年にわたり、いくつかの研究が実世界のピアノ演奏で手作りのコントローラーを実演し、他の研究はシミュレートされたピアノシナリオにおけるロボット学習のアプローチを評価した。
本稿では,学習アプローチを生かした最初のピアノ演奏ロボットシステムを開発した。
具体的には,Sim2Realを用いて,実世界のデキスタスロボットに学習ポリシーをデプロイする前に,強化学習を用いてシミュレーションのポリシーを訓練する。
実験では,領域ランダム化とシミュレーションで使用される動的モデルの精度との相互作用を徹底的に評価した。
さらに,学習方針の一般化を研究するために,複数の曲にまたがるロボットの性能を複雑に評価した。
実世界でピアノを弾くことを学ぶことの実証を提供することで、我々は、人間レベルの操作に向けた魅力的なベンチマークとして、ピアノを弾くことをコミュニティに奨励したいと考えています。
コードをオープンソース化し、https://lasr.org/research/learning-to-play-piano.orgで追加のビデオをお見せします。
関連論文リスト
- RP1M: A Large-Scale Motion Dataset for Piano Playing with Bi-Manual Dexterous Robot Hands [57.64308229980045]
ロボットピアノ100万のデータセットには,100万回以上の軌跡の動作データをバイマニュアルで演奏するロボットピアノが組み込まれている。
指の配置を最適な移動問題として定式化し、大量の未収録曲の自動アノテーションを可能にする。
既存の模倣学習手法のベンチマークでは、RP1Mを活用することにより、最先端のロボットピアノ演奏性能に達することが示されている。
論文 参考訳(メタデータ) (2024-08-20T17:56:52Z) - RoboPianist: Dexterous Piano Playing with Deep Reinforcement Learning [61.10744686260994]
本稿では,150曲のピアノ作品の大規模なレパートリーをシミュレートして学習するシステムであるRoboPianistを紹介する。
また,オープンソース環境,タスクのベンチマーク,解釈可能な評価指標,今後の研究課題についても紹介する。
論文 参考訳(メタデータ) (2023-04-09T03:53:05Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - DayDreamer: World Models for Physical Robot Learning [142.11031132529524]
深層強化学習はロボット学習の一般的なアプローチであるが、学習するには大量の試行錯誤が必要となる。
ロボット学習の多くの進歩はシミュレータに依存している。
本稿では,Dreamerを4つのロボットに適用し,シミュレータを使わずに,オンラインおよび実世界で直接学習する。
論文 参考訳(メタデータ) (2022-06-28T17:44:48Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - Towards Learning to Play Piano with Dexterous Hands and Touch [79.48656721563795]
そこで我々は,エージェントが機械可読音楽から直接学習して,模擬ピアノで器用な手でピアノを弾く方法を示した。
我々は、タッチ強化された報酬と、新しいタスクのカリキュラムを使用することで、これを実現する。
論文 参考訳(メタデータ) (2021-06-03T17:59:31Z) - High Acceleration Reinforcement Learning for Real-World Juggling with
Binary Rewards [35.55280687116388]
学習システムは,ロボットを傷つけることなく,現実世界でジャグリングすることを学ぶことができることを示す。
本システムは,56分間の経験から,高速なバレットWAMマニピュレータで2つのボールをジャグリングすることを可能にした。
最終方針は、最大33分間、または約4500回のキャッチを連続的にジャグリングする。
論文 参考訳(メタデータ) (2020-10-26T11:13:47Z) - robo-gym -- An Open Source Toolkit for Distributed Deep Reinforcement
Learning on Real and Simulated Robots [0.5161531917413708]
本稿では,ロボットによる深層強化学習を向上するためのオープンソースのツールキット,robo-gymを提案する。
シミュレーションにおけるトレーニングからロボットへのシームレスな移動を可能にするシミュレーション環境と実環境の統一的なセットアップを実証する。
産業用ロボットを特徴とする2つの実世界アプリケーションを用いて,本フレームワークの能力と有効性を示す。
論文 参考訳(メタデータ) (2020-07-06T13:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。