論文の概要: RFPPO: Motion Dynamic RRT based Fluid Field - PPO for Dynamic TF/TA Routing Planning
- arxiv url: http://arxiv.org/abs/2412.20098v1
- Date: Sat, 28 Dec 2024 09:42:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:04:55.311766
- Title: RFPPO: Motion Dynamic RRT based Fluid Field - PPO for Dynamic TF/TA Routing Planning
- Title(参考訳): RFPPO:動的RTR型流体場 -動的TF/TAルーティング計画のためのPPO-
- Authors: Rongkun Xue, Jing Yang, Yuyang Jiang, Yiming Feng, Zi Yang,
- Abstract要約: 本稿では、動的TF/TAルーティング計画のためのモーションダイナミックRTベース流体場(PPO)を提案する。
報酬関数は障害物回避、地形追従、地形回避、安全な飛行のための戦略を促進するように設計されている。
実DEMデータによる実験結果から,衝突のない軌道計画により長距離飛行のタスクを完了できることが示されている。
- 参考スコア(独自算出の注目度): 2.299967328525874
- License:
- Abstract: Existing local dynamic route planning algorithms, when directly applied to terrain following/terrain avoidance, or dynamic obstacle avoidance for large and medium-sized fixed-wing aircraft, fail to simultaneously meet the requirements of real-time performance, long-distance planning, and the dynamic constraints of large and medium-sized aircraft. To deal with this issue, this paper proposes the Motion Dynamic RRT based Fluid Field - PPO for dynamic TF/TA routing planning. Firstly, the action and state spaces of the proximal policy gradient algorithm are redesigned using disturbance flow fields and artificial potential field algorithms, establishing an aircraft dynamics model, and designing a state transition process based on this model. Additionally, a reward function is designed to encourage strategies for obstacle avoidance, terrain following, terrain avoidance, and safe flight. Experimental results on real DEM data demonstrate that our algorithm can complete long-distance flight tasks through collision-free trajectory planning that complies with dynamic constraints, without the need for prior global planning.
- Abstract(参考訳): 既存の動的経路計画アルゴリズムは、地形追従や地形回避、大型・中型固定翼機の動的障害物回避に直接適用する場合、リアルタイム性能、長距離計画、大型・中型機の動的制約の要件を同時に満たさない。
本稿では,動的TF/TAルーティング計画のためのPPOとして,モーションダイナミックRRTに基づく流体場を提案する。
まず、外乱流場と人工ポテンシャル場アルゴリズムを用いて、近似ポリシー勾配アルゴリズムの動作と状態空間を再設計し、航空機力学モデルを確立し、このモデルに基づいて状態遷移プロセスを設計する。
さらに、報酬関数は障害物回避、地形追従、地形回避、安全な飛行のための戦略を促進するように設計されている。
実DEMデータを用いた実験結果から, 衝突のない軌道計画法により, 従来のグローバル計画を必要とせず, 動的制約に適合した長距離飛行を行えることを示す。
関連論文リスト
- Dynamic Tube MPC: Learning Tube Dynamics with Massively Parallel Simulation for Robust Safety in Practice [28.37162791852146]
追跡不能なエラーは、安全を確保するために名目上の計画の堅牢化を必要とする。
本研究では,超並列シミュレーションを利用して動的チューブ表現を学習する手法を提案する。
結果のダイナミックMPCチューブは、3DホッピングロボットARCHERに適用される。
論文 参考訳(メタデータ) (2024-11-22T21:22:51Z) - Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Potential Based Diffusion Motion Planning [73.593988351275]
本稿では,潜在的行動計画の学習に向けた新しいアプローチを提案する。
我々はニューラルネットワークを訓練し、運動計画軌跡よりも容易に最適化可能なポテンシャルを捕捉し、学習する。
我々は、その固有の構成可能性を示し、様々な動きの制約に一般化することができる。
論文 参考訳(メタデータ) (2024-07-08T17:48:39Z) - A Safer Vision-based Autonomous Planning System for Quadrotor UAVs with
Dynamic Obstacle Trajectory Prediction and Its Application with LLMs [6.747468447244154]
本稿では,動的障害物の追跡と軌道予測を組み合わせて,効率的な自律飛行を実現するビジョンベース計画システムを提案する。
シミュレーション環境と実環境環境の両方で実験を行い,本研究の結果から動的環境の障害物をリアルタイムに検出・回避することが可能であることが示唆された。
論文 参考訳(メタデータ) (2023-11-21T08:09:00Z) - PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for
Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。
本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。
提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文 参考訳(メタデータ) (2023-01-19T08:42:40Z) - DDPEN: Trajectory Optimisation With Sub Goal Generation Model [70.36888514074022]
本稿では,エスケープネットワークを用いた微分動的プログラミング(DDPEN)を提案する。
本稿では,環境の入力マップとして,所望の位置とともにコストマップの形で利用する深層モデルを提案する。
このモデルは、目標に導く可能性のある将来の方向を生成し、リアルタイムに実行可能なローカルなミニマを避ける。
論文 参考訳(メタデータ) (2023-01-18T11:02:06Z) - Learning-based Motion Planning in Dynamic Environments Using GNNs and
Temporal Encoding [15.58317292680615]
組込みとエッジ優先化ポリシの両方を学習するために,データアグリゲーションを用いた時間符号化と模倣学習を用いたGNNベースのアプローチを提案する。
実験により, 提案手法は, 最先端の完全な動的計画アルゴリズムよりも, オンラインプランニングを著しく高速化できることが示された。
論文 参考訳(メタデータ) (2022-10-16T01:27:16Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z) - DPMPC-Planner: A real-time UAV trajectory planning framework for complex
static environments with dynamic obstacles [0.9462808515258462]
安全なUAVナビゲーションは、複雑な環境構造、動的障害物、計測ノイズによる不確実性、予測不可能な移動障害物の挙動のために困難である。
本稿では,動的障害物を伴う複雑な静的環境を考慮した安全なナビゲーションを実現するための軌道計画フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-14T23:51:02Z) - Trajectory Planning for Autonomous Vehicles Using Hierarchical
Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。
RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。
軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文 参考訳(メタデータ) (2020-11-09T20:49:54Z) - Path Planning Followed by Kinodynamic Smoothing for Multirotor Aerial
Vehicles (MAVs) [61.94975011711275]
そこで本稿では,RRT*textquotedblrightのテキストを幾何学的にベースとした動き計画手法を提案する。
提案手法では,適応探索空間とステアリング機能を導入したオリジナルのRT*を改良した。
提案手法を様々なシミュレーション環境で検証した。
論文 参考訳(メタデータ) (2020-08-29T09:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。