論文の概要: DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming
- arxiv url: http://arxiv.org/abs/2603.22263v1
- Date: Mon, 23 Mar 2026 17:49:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.827318
- Title: DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming
- Title(参考訳): DexDrummer:In-Hand, Contact-Rich, Long-Horizon Dexterous Robot Drumming
- Authors: Hung-Chieh Fang, Amber Xie, Jennifer Grannen, Kenneth Llontop, Dorsa Sadigh,
- Abstract要約: ドラムは自然に手動制御、コンタクトリッチな相互作用、長い水平調整を統合している。
本稿では,DexDrummerについて述べる。DexDrummerは,シミュレート・トゥ・リアル・トランスファーによるシミュレーションで訓練された階層的オブジェクト中心のバイマンダル・ドラム・ポリシーである。
巧妙な操作ポリシーは、指-スティックとスティック-ドラムの相互作用の両方を明示的にモデル化する報酬によって導かれる、コンタクトリッチなダイナミクスを扱う。
- 参考スコア(独自算出の注目度): 28.284862746585535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Performing in-hand, contact-rich, and long-horizon dexterous manipulation remains an unsolved challenge in robotics. Prior hand dexterity works have considered each of these three challenges in isolation, yet do not combine these skills into a single, complex task. To further test the capabilities of dexterity, we propose drumming as a testbed for dexterous manipulation. Drumming naturally integrates all three challenges: it involves in-hand control for stabilizing and adjusting the drumstick with the fingers, contact-rich interaction through repeated striking of the drum surface, and long-horizon coordination when switching between drums and sustaining rhythmic play. We present DexDrummer, a hierarchical object-centric bimanual drumming policy trained in simulation with sim-to-real transfer. The framework reduces the exploration difficulty of pure reinforcement learning by combining trajectory planning with residual RL corrections for fast transitions between drums. A dexterous manipulation policy handles contact-rich dynamics, guided by rewards that explicitly model both finger-stick and stick-drum interactions. In simulation, we show our policy can play two styles of music: multi-drum, bimanual songs and challenging, technical exercises that require increased dexterity. Across simulated bimanual tasks, our dexterous, reactive policy outperforms a fixed grasp policy by 1.87x across easy songs and 1.22x across hard songs F1 scores. In real-world tasks, we show song performance across a multi-drum setup. DexDrummer is able to play our training song and its extended version with an F1 score of 1.0.
- Abstract(参考訳): ロボット工学における未解決の課題は、手動で、接触に富んだ、そして長い水平な操作である。
以前は、これらの3つの課題のそれぞれを分離して検討していたが、これらのスキルを1つの複雑なタスクに組み合わせることはできなかった。
ディクスタリティの能力を更に検証するため,ディクスタラス操作のためのテストベッドとしてドラム加工を提案する。
ドラムは、ドラムスティックを指で安定・調整するための手動制御、ドラム面の繰り返し打撃によるコンタクトリッチな相互作用、ドラムを切り替えたりリズミカルな演奏を継続する際の長い水平調整、という3つの課題を自然に統合している。
本稿では,DexDrummerについて述べる。DexDrummerは,Sim-to-realトランスファーを用いたシミュレーションで訓練された階層的オブジェクト中心のバイマンダルドラム政策である。
この枠組みは、ドラム間の高速遷移のための軌道計画と残差RL補正を組み合わせることにより、純粋な強化学習の探索困難を低減させる。
巧妙な操作ポリシーは、指-スティックとスティック-ドラムの相互作用の両方を明示的にモデル化する報酬によって導かれる、コンタクトリッチなダイナミクスを扱う。
シミュレーションでは,マルチドラム,バイマニュアル楽曲,ディクスタリティの増大を必要とする技術的課題の2つのスタイルを演奏できることを示す。
シミュレーションされたバイマニュアルタスク全体にわたって、当社の厳密でリアクティブなポリシーは、簡単な曲で1.87倍、ハードソングで1.22倍という、固定的な把握ポリシーよりも優れています。
実世界のタスクでは,マルチドラム構成の楽曲のパフォーマンスを示す。
DexDrummerはF1スコア1.0のトレーニング曲と拡張バージョンを再生できます。
関連論文リスト
- HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies [32.80504141722999]
HandelBotは、シミュレーションポリシと、2段階のパイプラインによる迅速な適応を組み合わせたフレームワークである。
我々はHandelBotが正確にバイマニュアルピアノを演奏できることを実証した。
本システムでは, 直接シミュレーションの展開を1.8倍に向上させ, 30分間の物理的相互作用データを必要とする。
論文 参考訳(メタデータ) (2026-03-12T17:56:29Z) - DexterityGen: Foundation Controller for Unprecedented Dexterity [67.15251368211361]
ツール使用など,ロボットの巧妙な操作スキルを教えることは,大きな課題となる。
現在のアプローチは、人間の遠隔操作(模倣学習)とシミュレート・トゥ・リアル強化学習(sim-to-real reinforcement learning)の2つの戦略に大別できる。
本稿では,手動回転や翻訳などの大規模動きプリミティブをRLで事前学習するDexterityGenを紹介する。
現実の世界では、人間の遠隔操作をコントローラーのプロンプトとして利用し、厳密な振る舞いを生み出す。
論文 参考訳(メタデータ) (2025-02-06T18:49:35Z) - RP1M: A Large-Scale Motion Dataset for Piano Playing with Bi-Manual Dexterous Robot Hands [57.64308229980045]
ロボットピアノ100万のデータセットには,100万回以上の軌跡の動作データをバイマニュアルで演奏するロボットピアノが組み込まれている。
指の配置を最適な移動問題として定式化し、大量の未収録曲の自動アノテーションを可能にする。
既存の模倣学習手法のベンチマークでは、RP1Mを活用することにより、最先端のロボットピアノ演奏性能に達することが示されている。
論文 参考訳(メタデータ) (2024-08-20T17:56:52Z) - Twisting Lids Off with Two Hands [82.21668778600414]
シミュレーションで訓練された政策を実世界へ効果的かつ効率的に移行する方法を示す。
具体的には,ボトル状物体の蓋を両手でねじる問題について考察する。
これは、バイマガル・マルチフィンガーハンドでそのような機能を実現する最初のsim-to-real RLシステムである。
論文 参考訳(メタデータ) (2024-03-04T18:59:30Z) - JEN-1 Composer: A Unified Framework for High-Fidelity Multi-Track Music Generation [18.979064278674276]
JEN-1 Composerは、マルチトラック音楽上での限界分布、条件分布、共同分布を効率的にモデル化するように設計されている。
本研究では、段階的なカリキュラム学習戦略を導入し、段階的に訓練作業の難しさを増大させる。
提案手法は,制御可能かつ高忠実なマルチトラック音楽合成における最先端性能を示す。
論文 参考訳(メタデータ) (2023-10-29T22:51:49Z) - RoboPianist: Dexterous Piano Playing with Deep Reinforcement Learning [61.10744686260994]
本稿では,150曲のピアノ作品の大規模なレパートリーをシミュレートして学習するシステムであるRoboPianistを紹介する。
また,オープンソース環境,タスクのベンチマーク,解釈可能な評価指標,今後の研究課題についても紹介する。
論文 参考訳(メタデータ) (2023-04-09T03:53:05Z) - Generating Coherent Drum Accompaniment With Fills And Improvisations [8.334918207379172]
4つのメロディック楽器が演奏する伴奏音楽に基づくドラムパターン生成の課題に取り組む。
本稿では,近隣のバーの即興度を推定する新規関数を提案する。
メロディック伴奏トラックから即興位置を予測するためのモデルを訓練する。
論文 参考訳(メタデータ) (2022-09-01T08:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。