論文の概要: Navigation in a Three-Dimensional Urban Flow using Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2510.25679v1
- Date: Wed, 29 Oct 2025 16:46:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.805766
- Title: Navigation in a Three-Dimensional Urban Flow using Deep Reinforcement Learning
- Title(参考訳): 深部強化学習を用いた3次元都市流れのナビゲーション
- Authors: Federica Tonti, Ricardo Vinuesa,
- Abstract要約: 無人航空機(UAV)は、輸送と監視のために都市部で人口が増えている。
本研究では,Deep Reinforcement Learningに基づく最適なナビゲーション戦略を開発する。
その結果,PPO+LSTM,PPO+GTrXL,古典的ツェルメロのナビゲーションアルゴリズムと比較して,成功率 (SR) と低クラッシュ率 (CR) が有意に増加した。
- 参考スコア(独自算出の注目度): 3.306815791933257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unmanned Aerial Vehicles (UAVs) are increasingly populating urban areas for delivery and surveillance purposes. In this work, we develop an optimal navigation strategy based on Deep Reinforcement Learning. The environment is represented by a three-dimensional high-fidelity simulation of an urban flow, characterized by turbulence and recirculation zones. The algorithm presented here is a flow-aware Proximal Policy Optimization (PPO) combined with a Gated Transformer eXtra Large (GTrXL) architecture, giving the agent richer information about the turbulent flow field in which it navigates. The results are compared with a PPO+GTrXL without the secondary prediction tasks, a PPO combined with Long Short Term Memory (LSTM) cells and a traditional navigation algorithm. The obtained results show a significant increase in the success rate (SR) and a lower crash rate (CR) compared to a PPO+LSTM, PPO+GTrXL and the classical Zermelo's navigation algorithm, paving the way to a completely reimagined UAV landscape in complex urban environments.
- Abstract(参考訳): 無人航空機(UAV)は、輸送と監視のために都市部で人口が増えている。
本研究では,Deep Reinforcement Learningに基づく最適なナビゲーション戦略を開発する。
この環境は, 乱流と再循環帯を特徴とする都市流れの3次元高忠実度シミュレーションによって表現される。
このアルゴリズムは、Gated Transformer eXtra Large (GTrXL) アーキテクチャと組み合わされ、エージェントがナビゲートする乱流場に関するより豊かな情報を提供する。
結果は、二次予測タスクのないPPO+GTrXL、LSTM(Long Short Term Memory)セルを組み合わせたPPO、従来のナビゲーションアルゴリズムと比較される。
その結果,PPO+LSTM,PPO+GTrXL,古典的ツェルメロの航法アルゴリズムと比較して,成功率 (SR) と低クラッシュ率 (CR) が有意に増加し,複雑な都市環境における完全に再想像されたUAV景観への道を歩むことができた。
関連論文リスト
- UrbanPulse: A Cross-City Deep Learning Framework for Ultra-Fine-Grained Population Transfer Prediction [0.0]
UrbanPulseは、超微細で都市全体のODフロー予測を提供するスケーラブルなディープラーニングフレームワークである。
大規模な都市グラフの事前学習、コールドスタート適応、強化学習微調整という3段階の学習戦略を採用している。
最先端の精度とスケーラビリティを実現します。
論文 参考訳(メタデータ) (2025-07-23T20:44:25Z) - A Visual-inertial Localization Algorithm using Opportunistic Visual Beacons and Dead-Reckoning for GNSS-Denied Large-scale Applications [1.6599082439305994]
拡張現実(AR)により、歩行者はリアルタイムで視覚情報を取得することができる。
低コストな視覚慣性位置決めソリューションを提案する。
論文 参考訳(メタデータ) (2024-11-29T17:04:03Z) - Deep Heuristic Learning for Real-Time Urban Pathfinding [0.0]
本稿では,交通や気象条件などのリアルタイムな文脈データを活用するディープラーニングモデルに,従来のアルゴリズムを変換することで,都市パスフィニングへの新たなアプローチを提案する。
本稿では,現在の環境条件に基づいて経路を動的に調整する拡張A*アルゴリズムと,過去のデータとライブデータを用いて次の最適経路セグメントを予測するニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2024-11-07T00:22:04Z) - Navigation in a simplified Urban Flow through Deep Reinforcement Learning [0.9217021281095907]
都市環境における無人航空機(UAV)は、環境への影響を最小限に抑える戦略を必要とする。
我々の目標は、都市環境下での無人航法を可能にするDRLアルゴリズムを開発することである。
論文 参考訳(メタデータ) (2024-09-26T15:05:15Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。