論文の概要: Vector Field Augmented Differentiable Policy Learning for Vision-Based Drone Racing
- arxiv url: http://arxiv.org/abs/2603.08019v1
- Date: Mon, 09 Mar 2026 06:49:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.086662
- Title: Vector Field Augmented Differentiable Policy Learning for Vision-Based Drone Racing
- Title(参考訳): ヴィジュアルベースドローンレースにおけるベクトル場拡張型微分ポリシー学習
- Authors: Yang Su, Feng Yu, Yu Hu, Xinze Niu, Linzuo Zhang, Fangyu Sun, Danping Zou,
- Abstract要約: 微分物理学に基づく政策学習は、最近、様々なタスクにまたがる高いサンプル効率と顕著な性能を実証した。
DiffRacingは,新しいベクトル場拡張型微分可能なポリシー学習フレームワークである。
DiffRacingは、より優れたサンプル効率、より高速な収束、堅牢な飛行性能を実現する。
- 参考スコア(独自算出の注目度): 8.010590009724636
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Autonomous drone racing in complex environments requires agile, high-speed flight while maintaining reliable obstacle avoidance. Differentiable-physics-based policy learning has recently demonstrated high sample efficiency and remarkable performance across various tasks, including agile drone flight and quadruped locomotion. However, applying such methods to drone racing remains difficult, as key objective like gate traversal are inherently hard to express as smooth, differentiable losses. To address these challenges, we propose DiffRacing, a novel vector field-augmented differentiable policy learning framework. DiffRacing integrates differentiable losses and vector fields into the training process to provide continuous and stable gradient signals, balancing obstacle avoidance and high-speed gate traversal. In addition, a differentiable Delta Action Model compensates for dynamics mismatch, enabling efficient sim-to-real transfer without explicit system identification. Extensive simulation and real-world experiments demonstrate that DiffRacing achieves superior sample efficiency, faster convergence, and robust flight performance, thereby demonstrating that vector fields can augment traditional gradient-based policy learning with a task-specific geometric prior.
- Abstract(参考訳): 複雑な環境での自律ドローンレースは、信頼性の高い障害物回避を維持しながら、アジャイルで高速な飛行を必要とします。
微分物理学に基づくポリシー学習は、最近、アジャイルドローン飛行や四足歩行を含む様々なタスクにおける高いサンプル効率と顕著なパフォーマンスを実証した。
しかし、ゲートトラバーサルのような重要な目的は、本質的にスムーズで微分可能な損失として表現することが難しいため、そのような手法をドローンレースに適用することは依然として困難である。
これらの課題に対処するために,新しいベクトル場拡張型微分可能なポリシー学習フレームワークであるDiffRacingを提案する。
DiffRacingは、異なる損失とベクトル場をトレーニングプロセスに統合し、連続的かつ安定した勾配信号を提供し、障害物回避と高速ゲートトラバースのバランスをとる。
さらに、微分可能なDelta Action Modelは、動的ミスマッチを補償し、明示的なシステム識別なしに効率的なsim-to-real転送を可能にする。
大規模なシミュレーションと実世界の実験により、DiffRacingはより優れたサンプル効率、より高速な収束、堅牢な飛行性能を実現し、ベクトル場が従来の勾配に基づく政策学習をタスク固有の幾何的事前学習で拡張できることが示される。
関連論文リスト
- RIFT: Group-Relative RL Fine-Tuning for Realistic and Controllable Traffic Simulation [13.319344167881383]
データ駆動シミュレーターにおいて、模擬学習事前学習を行う2段階のAV中心シミュレーションフレームワークを導入する。
次に、物理に基づくシミュレータで微調整を学習し、スタイルレベルの制御性を向上する。
微調整段階において,新しいグループ関連RL微調整戦略であるRIFTを提案する。
論文 参考訳(メタデータ) (2025-05-06T09:12:37Z) - Effective and Efficient Representation Learning for Flight Trajectories [13.128434340483572]
我々は、異なる飛行分析タスクが軌道の同じ有用な特徴を共有していると論じる。
Flight2Vecは、これらの課題に対処するためのフライト固有の表現学習手法である。
論文 参考訳(メタデータ) (2024-12-21T10:59:54Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Biologically Inspired Swarm Dynamic Target Tracking and Obstacle Avoidance [0.0]
本研究では、軍用分散ドローン群を用いた動的目標追跡のためのAI駆動飛行コンピュータを提案する。
コントローラはファジィインタフェース、素早い適応、予測能力、マルチエージェント問題解決を可能にするニューラルネットワークを統合する。
論文 参考訳(メタデータ) (2024-10-15T03:47:09Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Learning High-Speed Flight in the Wild [101.33104268902208]
複雑な自然環境や人工環境を高速で自律的に飛行するエンド・ツー・エンドのアプローチを提案する。
鍵となる原理は、雑音の知覚観測を直接、後退水平方向に無衝突軌道にマッピングすることである。
現実的なセンサノイズをシミュレートすることにより,シミュレーションから現実環境へのゼロショット転送を実現する。
論文 参考訳(メタデータ) (2021-10-11T09:43:11Z) - Identification and Avoidance of Static and Dynamic Obstacles on Point
Cloud for UAVs Navigation [7.14505983271756]
クラウド入力のみを点とする静的障害と動的障害を区別する手法を提案する。
計算効率の良い障害物回避運動計画手法を提案し, 改良された相対速度法と一致している。
このアプローチは、同じフレームワークの静的障害と動的障害の両方を避けることができる。
論文 参考訳(メタデータ) (2021-05-14T02:44:18Z) - Continuous Transition: Improving Sample Efficiency for Continuous
Control Problems via MixUp [119.69304125647785]
本稿では,連続的遷移を構築するための簡潔かつ強力な手法を提案する。
具体的には、連続的な遷移を線形に補間することにより、トレーニングのための新しい遷移を合成することを提案する。
また, 建設過程を自動案内する判別器を開発した。
論文 参考訳(メタデータ) (2020-11-30T01:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。