論文の概要: High-Speed Vision-Based Flight in Clutter with Safety-Shielded Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2602.08653v1
- Date: Mon, 09 Feb 2026 13:47:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.288639
- Title: High-Speed Vision-Based Flight in Clutter with Safety-Shielded Reinforcement Learning
- Title(参考訳): 安全シールド強化学習によるクラッタ内高速ビジョンベース飛行
- Authors: Jiarui Zhang, Chengyong Lei, Chengjiang Dai, Lijie Wang, Zhichao Han, Fei Gao,
- Abstract要約: モデルに基づく安全機構を付加したエンドツーエンドのRLフレームワークを提案する。
トレーニング中は、グローバルなナビゲーションガイダンスを提供する物理インフォームド報酬構造を設計する。
配置中、我々は、厳密な衝突回避制約を強制するために、ポリシー出力を証明可能な安全なセットに投影するリアルタイム安全フィルタを統合する。
- 参考スコア(独自算出の注目度): 7.796497371549364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quadrotor unmanned aerial vehicles (UAVs) are increasingly deployed in complex missions that demand reliable autonomous navigation and robust obstacle avoidance. However, traditional modular pipelines often incur cumulative latency, whereas purely reinforcement learning (RL) approaches typically provide limited formal safety guarantees. To bridge this gap, we propose an end-to-end RL framework augmented with model-based safety mechanisms. We incorporate physical priors in both training and deployment. During training, we design a physics-informed reward structure that provides global navigational guidance. During deployment, we integrate a real-time safety filter that projects the policy outputs onto a provably safe set to enforce strict collision-avoidance constraints. This hybrid architecture reconciles high-speed flight with robust safety assurances. Benchmark evaluations demonstrate that our method outperforms both traditional planners and recent end-to-end obstacle avoidance approaches based on differentiable physics. Extensive experiments demonstrate strong generalization, enabling reliable high-speed navigation in dense clutter and challenging outdoor forest environments at velocities up to 7.5m/s.
- Abstract(参考訳): クアドロター無人航空機(UAV)は、信頼性の高い自律航法と堅牢な障害物回避を要求する複雑な任務にますます配備されている。
しかし、従来のモジュールパイプラインはしばしば累積レイテンシを発生させるが、純粋な強化学習(RL)アプローチは通常、形式的な安全性を保証する。
このギャップを埋めるために,モデルに基づく安全機構を付加したエンドツーエンドのRLフレームワークを提案する。
トレーニングとデプロイメントの両方に物理的な優先順位を取り入れています。
トレーニング中は、グローバルなナビゲーションガイダンスを提供する物理インフォームド報酬構造を設計する。
配置中、我々は、厳密な衝突回避制約を強制するために、ポリシー出力を証明可能な安全なセットに投影するリアルタイム安全フィルタを統合する。
このハイブリッドアーキテクチャは、堅牢な安全保証で高速飛行を調整します。
ベンチマーク評価により,本手法は従来のプランナーと,微分可能な物理に基づく近年のエンドツーエンドの障害物回避手法の両方に優れることが示された。
広汎な実験は強力な一般化を示し、密集した乱雑な環境において信頼性の高い高速航行を可能にし、最高7.5m/sの速度で屋外の森林環境に挑戦する。
関連論文リスト
- OnFly: Onboard Zero-Shot Aerial Vision-Language Navigation toward Safety and Efficiency [9.769964979769204]
ゼロショットAVLNのためのフルオンボードリアルタイムフレームワークOnFlyを提案する。
OnFlyは、低周波進行監視から高周波目標生成を分離する、共有パーセプション二重エージェントアーキテクチャを採用している。
シミュレーションでは、OnFlyは最強の最先端ベースラインと比較してタスク成功率を26.4%から67.8%に改善している。
論文 参考訳(メタデータ) (2026-03-11T11:48:22Z) - SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments [16.354808611554805]
SEA-Navは四足歩行のための強化学習フレームワークである。
CBFベースのシールドは、安全な速度コマンドを出力するためにナビゲーションポリシーを制約する。
適応的な衝突再現機構と有害な探索報酬を導入し、学習の確率を高める。
論文 参考訳(メタデータ) (2026-03-10T10:13:49Z) - BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Learning Agile Quadrotor Flight in the Real World [24.272916786375365]
学習ベースのコントローラは、アジャイルの4倍体飛行で素晴らしいパフォーマンスを達成したが、一般的にはシミュレーションの大規模なトレーニングに依存している。
システム識別やオフラインのSim2Real転送を必要としない自己適応型フレームワークを提案する。
本稿では、適応時間スケーリング(ATS)を導入し、プラットフォーム物理限界を積極的に探求し、オンライン残差学習を用いて単純な名目モデルを強化する。
論文 参考訳(メタデータ) (2026-02-10T18:59:28Z) - Q-realign: Piggybacking Realignment on Quantization for Safe and Efficient LLM Deployment [55.14890249389052]
既存の防衛は、安全回復を微調整に埋め込んだり、微調整による修正に先立って微調整に頼ったりしている。
我々は,ポストトレーニング量子化に基づくポストホック防御手法であるtextttQ-realign を提案する。
私たちの仕事は、安全を意識したデプロイメントのための実践的でターンキーなソリューションを提供します。
論文 参考訳(メタデータ) (2026-01-13T00:07:24Z) - Trajectory Design for UAV-Based Low-Altitude Wireless Networks in Unknown Environments: A Digital Twin-Assisted TD3 Approach [62.11847362756054]
低高度無線ネットワーク(LAWN)のキーイネーブラーとして無人航空機(UAV)が登場している
我々は、デジタルツイン(DT)支援トレーニングおよびデプロイメントフレームワークを提案する。
このフレームワークでは、UAVは統合されたセンシングと通信信号を送信し、地上ユーザーに通信サービスを提供し、同時にDTサーバにアップロードされたエコーを収集して、仮想環境(VE)を段階的に構築する。
これらのVEはモデルトレーニングを加速し、展開中のリアルタイムUAVセンシングデータを継続的に更新し、意思決定をサポートし、飛行安全性を向上する。
論文 参考訳(メタデータ) (2025-10-28T10:05:53Z) - UpSafe$^\circ$C: Upcycling for Controllable Safety in Large Language Models [67.91151588917396]
大規模言語モデル(LLM)は、幅広いタスクで顕著な進歩を遂げているが、有害なコンテンツ生成やジェイルブレイク攻撃といった安全リスクに弱いままである。
安全に配慮したリサイクルによるLCMの安全性向上のための統合フレームワークであるUpSafe$circ$Cを提案する。
この結果から, 静的アライメントから動的, モジュール, 推論対応制御への移行という, LLMの安全性の新たな方向性が明らかになった。
論文 参考訳(メタデータ) (2025-10-02T16:43:33Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - Learned Controllers for Agile Quadrotors in Pursuit-Evasion Games [42.74003740156243]
我々は,アジャイル1v1クアッドロータ追従回避の問題に対処する。
これらの問題に対処するために,非同期多段階人口ベース (AMSPB) アルゴリズムを提案する。
このフレームワークでは、ベロシティコマンドまたはボディーレートを集合推力で出力するニューラルネットワークコントローラをトレーニングします。
論文 参考訳(メタデータ) (2025-06-03T13:19:23Z) - Monocular Obstacle Avoidance Based on Inverse PPO for Fixed-wing UAVs [29.207513994002202]
固定翼無人航空機(英語: Fixed-wing Unmanned Aerial Vehicles、UAV)は、低高度経済(LAE)と都市空運(UAM)のための最も一般的なプラットフォームの一つである。
従来の地図や高度なセンサーに依存する古典的な障害物回避システムは、未知の低高度環境や小型UAVプラットフォームにおいて制限に直面している。
本稿では,DRLに基づくUAV衝突回避システムを提案する。
論文 参考訳(メタデータ) (2024-11-27T03:03:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。