論文の概要: HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies
- arxiv url: http://arxiv.org/abs/2603.12243v2
- Date: Sun, 15 Mar 2026 17:16:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.730511
- Title: HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies
- Title(参考訳): HandelBot:Dexterous Robot Policiesの高速適応による現実世界のピアノ演奏
- Authors: Amber Xie, Haozhi Qi, Dorsa Sadigh,
- Abstract要約: HandelBotは、シミュレーションポリシと、2段階のパイプラインによる迅速な適応を組み合わせたフレームワークである。
我々はHandelBotが正確にバイマニュアルピアノを演奏できることを実証した。
本システムでは, 直接シミュレーションの展開を1.8倍に向上させ, 30分間の物理的相互作用データを必要とする。
- 参考スコア(独自算出の注目度): 32.80504141722999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mastering dexterous manipulation with multi-fingered hands has been a grand challenge in robotics for decades. Despite its potential, the difficulty of collecting high-quality data remains a primary bottleneck for high-precision tasks. While reinforcement learning and simulation-to-real-world transfer offer a promising alternative, the transferred policies often fail for tasks demanding millimeter-scale precision, such as bimanual piano playing. In this work, we introduce HandelBot, a framework that combines a simulation policy and rapid adaptation through a two-stage pipeline. Starting from a simulation-trained policy, we first apply a structured refinement stage to correct spatial alignments by adjusting lateral finger joints based on physical rollouts. Next, we use residual reinforcement learning to autonomously learn fine-grained corrective actions. Through extensive hardware experiments across five recognized songs, we demonstrate that HandelBot can successfully perform precise bimanual piano playing. Our system outperforms direct simulation deployment by a factor of 1.8x and requires only 30 minutes of physical interaction data.
- Abstract(参考訳): マルチフィンガーハンドで巧妙な操作をマスターすることは、ロボット工学において何十年にもわたって大きな課題だった。
その可能性にもかかわらず、高品質なデータを集めることの難しさは、高精度なタスクの主要なボトルネックである。
強化学習や実世界へのシミュレーション・トゥ・リアル・トランスファーは有望な代替手段となるが、バイマニュアルピアノ演奏のようなミリスケールの精度を必要とするタスクでは、転送ポリシーは失敗することが多い。
本研究では,シミュレーションポリシと2段階パイプラインによる迅速な適応を組み合わせたフレームワークであるHandelBotを紹介する。
シミュレーション学習から始め, 物理的ロールアウトに基づいて横指関節を調整することにより, 空間アライメントの補正に構造化された改良段階を適用した。
次に、残留強化学習を用いて、きめ細かい補正行動を自律的に学習する。
5曲にわたるハードウェア実験を通じて、HandelBotが正確にバイマニュアルピアノを演奏できることを実証した。
本システムでは, 直接シミュレーションの展開を1.8倍に向上させ, 30分間の物理インタラクションデータしか必要としない。
関連論文リスト
- VTAO-BiManip: Masked Visual-Tactile-Action Pre-training with Object Understanding for Bimanual Dexterous Manipulation [8.882764358932276]
両手の DoF の高さと協調性のため、ロボット工学における両面的な操作は依然として重要な課題である。
既存の片手操作技術は、人間のデモンストレーションを利用してRL法を誘導するが、複数のサブスキルを含む複雑な双対タスクに一般化できないことが多い。
VTAO-BiManipは,視覚触覚前訓練と物体理解を組み合わせた新しいフレームワークである。
論文 参考訳(メタデータ) (2025-01-07T08:14:53Z) - Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.54757719504994]
本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文 参考訳(メタデータ) (2024-10-01T19:49:56Z) - RP1M: A Large-Scale Motion Dataset for Piano Playing with Bi-Manual Dexterous Robot Hands [57.64308229980045]
ロボットピアノ100万のデータセットには,100万回以上の軌跡の動作データをバイマニュアルで演奏するロボットピアノが組み込まれている。
指の配置を最適な移動問題として定式化し、大量の未収録曲の自動アノテーションを可能にする。
既存の模倣学習手法のベンチマークでは、RP1Mを活用することにより、最先端のロボットピアノ演奏性能に達することが示されている。
論文 参考訳(メタデータ) (2024-08-20T17:56:52Z) - Bi-Manual Block Assembly via Sim-to-Real Reinforcement Learning [24.223788665601678]
2つのxArm6ロボットがU字型組立タスクを、シミュレーションで90%以上、実際のハードウェアで50%の確率で解決する。
以上の結果から,本システムは今後,深部RLおよびSim2Real転送バイマニュアルポリアの研究を刺激していきたいと願っている。
論文 参考訳(メタデータ) (2023-03-27T01:25:24Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。