論文の概要: Curriculum Reinforcement Learning for Quadrotor Racing with Random Obstacles
- arxiv url: http://arxiv.org/abs/2602.24030v1
- Date: Fri, 27 Feb 2026 13:56:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.767329
- Title: Curriculum Reinforcement Learning for Quadrotor Racing with Random Obstacles
- Title(参考訳): ランダム障害物をもつ四輪車レースのカリキュラム強化学習
- Authors: Fangyu Sun, Fanxing Li, Yu Hu, Linzuo Zhang, Yueqian Liu, Wenxian Yu, Danping Zou,
- Abstract要約: 本稿では,ドローンレースにおける未知の障害に対処できるロバストコントローラをトレーニングするための,視覚に基づくカリキュラム強化学習フレームワークを提案する。
我々のエンドツーエンド制御ポリシは単一ネットワークとして実装されており、可変障害物環境下での高速飛行を可能にする。
- 参考スコア(独自算出の注目度): 12.806994271928483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous drone racing has attracted increasing interest as a research topic for exploring the limits of agile flight. However, existing studies primarily focus on obstacle-free racetracks, while the perception and dynamic challenges introduced by obstacles remain underexplored, often resulting in low success rates and limited robustness in real-world flight. To this end, we propose a novel vision-based curriculum reinforcement learning framework for training a robust controller capable of addressing unseen obstacles in drone racing. We combine multi-stage cu rriculum learning, domain randomization, and a multi-scene updating strategy to address the conflicting challenges of obstacle avoidance and gate traversal. Our end-to-end control policy is implemented as a single network, allowing high-speed flight of quadrotors in environments with variable obstacles. Both hardware-in-the-loop and real-world experiments demonstrate that our method achieves faster lap times and higher success rates than existing approaches, effectively advancing drone racing in obstacle-rich environments. The video and code are available at: https://github.com/SJTU-ViSYS-team/CRL-Drone-Racing.
- Abstract(参考訳): 自律型ドローンレースは、アジャイル飛行の限界を探求する研究トピックとして、関心を集めている。
しかし、既存の研究は主に障害物のない競馬場に焦点を当てているが、障害物によって引き起こされる知覚と動的課題は未発見のままであり、しばしば成功率の低下と現実の飛行における頑健さの制限をもたらす。
そこで本研究では,ドローンレースにおける未知の障害に対処可能な頑健なコントローラをトレーニングするための,視覚に基づく新たなカリキュラム強化学習フレームワークを提案する。
障害回避とゲートトラバーサルの相反する問題に対処するために,多段階のcuリキュラム学習,ドメインランダム化,マルチステージ更新戦略を組み合わせる。
我々のエンドツーエンド制御ポリシは単一ネットワークとして実装されており、可変障害物環境下での高速飛行を可能にする。
ハードウェア・イン・ザ・ループと実世界の実験の両方で、我々の手法は既存の手法よりも高速なラップタイムと高い成功率を実現し、障害物の多い環境でのドローンレースを効果的に進めることを示した。
ビデオとコードは、https://github.com/SJTU-ViSYS-team/CRL-Drone-Racing.comで公開されている。
関連論文リスト
- SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments [16.354808611554805]
SEA-Navは四足歩行のための強化学習フレームワークである。
CBFベースのシールドは、安全な速度コマンドを出力するためにナビゲーションポリシーを制約する。
適応的な衝突再現機構と有害な探索報酬を導入し、学習の確率を高める。
論文 参考訳(メタデータ) (2026-03-10T10:13:49Z) - Vector Field Augmented Differentiable Policy Learning for Vision-Based Drone Racing [8.010590009724636]
微分物理学に基づく政策学習は、最近、様々なタスクにまたがる高いサンプル効率と顕著な性能を実証した。
DiffRacingは,新しいベクトル場拡張型微分可能なポリシー学習フレームワークである。
DiffRacingは、より優れたサンプル効率、より高速な収束、堅牢な飛行性能を実現する。
論文 参考訳(メタデータ) (2026-03-09T06:49:41Z) - SPIRAL: Self-Play Incremental Racing Algorithm for Learning in Multi-Drone Competitions [0.0]
本稿では,マルチエージェントレースにおける自律ドローンのトレーニング手法であるSPIRALを紹介する。
SPIRALは、複雑なレースの振る舞いを漸進的に培養するセルフプレイ機構を特有に採用している。
本手法は汎用性のために設計されており,最先端のDeep Reinforcement Learning (DRL)アルゴリズムと統合可能である。
論文 参考訳(メタデータ) (2025-10-26T07:59:44Z) - Learning Generalizable Policy for Obstacle-Aware Autonomous Drone Racing [0.0]
本研究は、一般化可能な障害物対応ドローンレースポリシーを開発することの課題に対処する。
本稿では,各ロールアウト前にレーストラックと障害物構成にドメインランダム化を適用することを提案する。
提案したランダム化戦略は、ドローンが最大70km/hの速度に達するシミュレーション実験によって有効であることが示されている。
論文 参考訳(メタデータ) (2024-11-06T20:25:43Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - A Dual Curriculum Learning Framework for Multi-UAV Pursuit-Evasion in Diverse Environments [15.959963737956848]
本稿では,無人機群が障害物のある制限された環境で高速離着陸機を捕獲するために協力するマルチUAV追跡回避について述べる。
追従回避問題を単純化する既存のアルゴリズムは、しばしば表現力のある協調戦略を欠き、極端なシナリオで回避者を捕まえるのに苦労する。
多様な環境下でのマルチUAV追従回避に対処し,未知のシナリオに対するゼロショット転送能力を実証するデュアルカリキュラム学習フレームワークDualCLを導入する。
論文 参考訳(メタデータ) (2023-12-19T15:39:09Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Vision-Based Mobile Robotics Obstacle Avoidance With Deep Reinforcement
Learning [49.04274612323564]
障害物回避は、移動ロボットの自律ナビゲーションのための根本的かつ困難な問題です。
本稿では,ロボットが単一眼カメラにのみ依存しなければならない単純な3D環境における障害物回避の問題を検討する。
データ駆動型エンドツーエンドディープラーニングアプローチとして,障害回避問題に取り組む。
論文 参考訳(メタデータ) (2021-03-08T13:05:46Z) - AirSim Drone Racing Lab [56.68291351736057]
AirSim Drone Racing Labは、この領域で機械学習研究を可能にするシミュレーションフレームワークである。
本フレームワークは,複数の写真リアル環境下でのレーストラック生成を可能にする。
当社のフレームワークを使用して,NeurIPS 2019で,シミュレーションベースのドローンレースコンペティションを開催しました。
論文 参考訳(メタデータ) (2020-03-12T08:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。