論文の概要: Learning Reactive Dexterous Grasping via Hierarchical Task-Space RL Planning and Joint-Space QP Control
- arxiv url: http://arxiv.org/abs/2605.03363v1
- Date: Tue, 05 May 2026 04:49:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.770972
- Title: Learning Reactive Dexterous Grasping via Hierarchical Task-Space RL Planning and Joint-Space QP Control
- Title(参考訳): 階層型タスク空間RL計画と共同空間QP制御によるリアクティブデキスタラスグラスピングの学習
- Authors: Ho Jae Lee, Yonghyeon Lee, Alexander Alexiev, Tzu-Yuan Lin, Se Hwan Jeon, Sangbae Kim,
- Abstract要約: 本稿では,リアクティブなデクスタリーグルーピングのためのハイブリッド階層型制御フレームワークを提案する。
提案手法は,低レベル共同実行から高レベル空間意図を明示的に分離する。
我々は厳密なシミュレーションと現実のパイプラインを通して提案したフレームワークを広範囲に検証する。
- 参考スコア(独自算出の注目度): 50.28263951510334
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we propose a hybrid hierarchical control framework for reactive dexterous grasping that explicitly decouples high-level spatial intent from low-level joint execution. We introduce a multi-agent reinforcement learning architecture, specialized into distinct arm and hand agents, that acts as a high-level planner by generating desired task-space velocity commands. These commands are then processed by a GPU-parallelized quadratic programming controller, which translates them into feasible joint velocities while strictly enforcing kinematic limits and collision avoidance. This structural isolation not only accelerates training convergence but also strictly enforces hardware safety. Furthermore, the architecture unlocks zero-shot steerability, allowing system operators to dynamically adjust safety margins and avoid dynamic obstacles without retraining the policy. We extensively validate the proposed framework through a rigorous simulation-to-reality pipeline. Real-world hardware experiments on a 7-DoF arm equipped with a 20-DoF anthropomorphic hand demonstrate highly robust zero-shot transferability for dexterous grasping to a diverse set of unseen objects, highlighting the system's ability to reactively recover from unexpected physical disturbances in unstructured environments.
- Abstract(参考訳): 本研究では,高レベルな空間的意図を低レベルな共同実行から明確に分離する,リアクティブデクスタラス把握のためのハイブリッド階層型制御フレームワークを提案する。
所望のタスク空間速度コマンドを生成することで高レベルプランナとして機能する,異なるアームとハンドエージェントに特化したマルチエージェント強化学習アーキテクチャを提案する。
これらのコマンドはGPU並列化された二次プログラミングコントローラによって処理され、運動制限と衝突回避を厳格に実施しながら、実行可能な関節速度に変換される。
この構造的分離は、トレーニングの収束を加速するだけでなく、ハードウェアの安全性を厳格に強制する。
さらに、このアーキテクチャはゼロショットのステアビリティを解放し、システムオペレーターは安全マージンを動的に調整し、ポリシーを再訓練することなく動的障害を回避することができる。
我々は厳密なシミュレーションと現実のパイプラインを通して提案したフレームワークを広範囲に検証する。
20-DoFの人為的手を備えた7-DoFアームを用いた実世界のハードウェア実験は、様々な未知の物体の集合にデキスタラスを掴むための非常に堅牢なゼロショット転送可能性を示し、非構造環境における予期せぬ物理的障害から反応的に回復するシステムの能力を強調している。
関連論文リスト
- Navigating the Clutter: Waypoint-Based Bi-Level Planning for Multi-Robot Systems [54.887871365121775]
乱雑な環境におけるマルチロボット制御は、複雑な物理的制約を伴う難しい問題である。
タスクとモーションプランニングを協調的に最適化するハイブリッドマルチロボット制御フレームワークを提案する。
我々のアプローチは、動作に依存しないベースラインとVLAベースのベースラインよりもタスクの成功を継続的に改善する。
論文 参考訳(メタデータ) (2026-04-22T22:58:47Z) - Towards Space-Based Environmentally-Adaptive Grasping [45.88028371034407]
宇宙環境における把握の例を通して,限界について検討する。
我々は、複数のモダリティを、ポリシー決定のための構造化された表現に融合(文法化)する学習された潜在多様体において、制御ポリシーを直接学習する。
論文 参考訳(メタデータ) (2026-01-29T08:31:03Z) - Learning to Move in Rhythm: Task-Conditioned Motion Policies with Orbital Stability Guarantees [45.137864140049814]
我々は,学習した微分型エンコーダと超臨界ホップ分岐を結合したフレームワークであるOrbitally Stable Motion Primitives (OSMPs)を紹介する。
提案手法は,多種多様なロボットプラットフォームにまたがる広範囲なシミュレーションと実世界の実験によって検証される。
論文 参考訳(メタデータ) (2025-07-12T17:10:03Z) - A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - PIP-Loco: A Proprioceptive Infinite Horizon Planning Framework for Quadrupedal Robot Locomotion [1.123472110161393]
四足歩行におけるモデル予測制御(MPC)の強みは、制約を強制する能力である。
自己受容型計画と強化学習(RL)を統合した枠組みを提案する。
デプロイ中、Dreamerモジュールは無限水平MPC問題を解決する。
論文 参考訳(メタデータ) (2024-09-14T13:51:37Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。