論文の概要: Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper
- arxiv url: http://arxiv.org/abs/2603.05935v1
- Date: Fri, 06 Mar 2026 06:07:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.979033
- Title: Swooper: Learning High-Speed Aerial Grasping With a Simple Gripper
- Title(参考訳): Swooper: 単純なグリッパーで高速空中グラスピングを学習する
- Authors: Ziken Huang, Xinze Niu, Bowen Chai, Renbiao Jin, Danping Zou,
- Abstract要約: 高速空中グリップは、精密で応答性の高い飛行制御とグリップ操作の調整が要求されるため、大きな課題となる。
本研究では, 高精度飛行制御とアクティブグリップ制御を両立させる, 深部強化学習(DRL)に基づくアプローチであるSwooperを提案する。
実世界の25の試験において、我々の政策は84%の成功率と1.5m/sまでの速度を微調整なしで把握する。
- 参考スコア(独自算出の注目度): 3.894377831948157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-speed aerial grasping presents significant challenges due to the high demands on precise, responsive flight control and coordinated gripper manipulation. In this work, we propose Swooper, a deep reinforcement learning (DRL) based approach that achieves both precise flight control and active gripper control using a single lightweight neural network policy. Training such a policy directly via DRL is nontrivial due to the complexity of coordinating flight and grasping. To address this, we adopt a two-stage learning strategy: we first pre-train a flight control policy, and then fine-tune it to acquire grasping skills. With the carefully designed reward functions and training framework, the entire training process completes in under 60 minutes on a standard desktop with an Nvidia RTX 3060 GPU. To validate the trained policy in the real world, we develop a lightweight quadrotor grasping platform equipped with a simple off-the-shelf gripper, and deploy the policy in a zero-shot manner on the onboard Raspberry Pi 4B computer, where each inference takes only about 1.0 ms. In 25 real-world trials, our policy achieves an 84% grasp success rate and grasping speeds of up to 1.5 m/s without any fine-tuning. This matches the robustness and agility of state-of-the-art classical systems with sophisticated grippers, highlighting the capability of DRL for learning a robust control policy that seamlessly integrates high-speed flight and grasping. The supplementary video is available for more results. Video: https://zikenhuang.github.io/Swooper/.
- Abstract(参考訳): 高速空中グリップは、精密で応答性の高い飛行制御とグリップ操作の調整が要求されるため、大きな課題となる。
本研究では,1つの軽量ニューラルネットワークポリシを用いて,高精度飛行制御とアクティブグリップ制御の両方を実現する,深層強化学習(DRL)に基づくアプローチであるSwooperを提案する。
このような方針をDRLを介して直接訓練することは、飛行の調整と把握の複雑さのために簡単ではない。
これに対処するため、我々はまず飛行制御ポリシーを事前訓練し、次にそれを微調整して把握スキルを得るという2段階の学習戦略を採用した。
慎重に設計された報酬関数とトレーニングフレームワークによって、トレーニングプロセス全体が、Nvidia RTX 3060 GPUを備えた標準デスクトップ上で60分未満で完了する。
実世界における訓練された方針を検証するため,簡単なオフザシェルフグリップを備えた軽量な四重項把握プラットフォームを開発し,各推論が約1.0msのRaspberry Pi 4Bコンピュータ上でゼロショットで展開し,実世界25回の試行で84%の成功率と1.5m/sまでの速度を微調整なしで達成した。
これは最先端の古典システムの堅牢性と俊敏性と洗練されたグリッパーとを一致させ、高速飛行と把握をシームレスに統合する堅牢な制御ポリシーを学ぶためのDRLの能力を強調している。
追加ビデオは、さらなる結果が提供されている。
ビデオ: https://zikenhuang.github.io/Swooper/。
関連論文リスト
- Learning Sim-to-Real Humanoid Locomotion in 15 Minutes [51.500643119683225]
本稿では,FastSACとFastTD3という,非政治的RLアルゴリズムに基づくシンプルで実用的なレシピを提案する。
我々の単純なレシピは、何千もの並列環境において、政治外のRLアルゴリズムを大規模に安定化させる。
我々は,Unitree G1 と Booster T1 ロボット上でのヒューマノイド移動制御器のエンドツーエンドの迅速な学習を実演する。
論文 参考訳(メタデータ) (2025-12-01T18:55:17Z) - RAPTOR: A Foundation Policy for Quadrotor Control [7.1760769144571865]
人間は、新しい車を運転するなど、目に見えない新しい状況に適応するとき、驚くほどデータ効率が良い。
強化学習(Reinforcement Learning)を使用してトレーニングされたニューラルネットワークポリシのような、現代のロボット制御システムは、単一の環境に非常に特化している。
本稿では,四元数制御のための高度適応的基本方針の学習方法であるRAPTORについて述べる。
論文 参考訳(メタデータ) (2025-09-15T00:05:40Z) - A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study [24.239835581921458]
実世界の四角形におけるゼロショット展開が可能なロバストなRL制御ポリシーを学習するための重要な要因について検討する。
これら5つのテクニックを統合した,PPOベースのトレーニングフレームワークSimpleFlightを開発した。
クレージーフリー四重極に対するSimpleFlightの有効性を検証し,軌道追従誤差を50%以上低減できることを実証した。
論文 参考訳(メタデータ) (2024-12-16T13:31:26Z) - DigiRL: Training In-The-Wild Device-Control Agents with Autonomous Reinforcement Learning [61.10299147201369]
本稿では,Wild デバイス制御エージェントをトレーニングするための新しい自律型 RL 手法である DigiRL を提案する。
VLMベースの評価器を備えた,スケーラブルで並列化可能なAndroid学習環境を構築する。
我々はAndroid-in-the-Wildデータセットを使用してDigiRLの有効性を実証し、RLでトレーニングした1.3B VLMは49.5%の絶対改善を実現した。
論文 参考訳(メタデータ) (2024-06-14T17:49:55Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Real-Time Model-Free Deep Reinforcement Learning for Force Control of a
Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。
モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。
深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文 参考訳(メタデータ) (2023-04-11T00:51:47Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。