論文の概要: The Emergence of Deep Reinforcement Learning for Path Planning
- arxiv url: http://arxiv.org/abs/2507.15469v1
- Date: Mon, 21 Jul 2025 10:21:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.355269
- Title: The Emergence of Deep Reinforcement Learning for Path Planning
- Title(参考訳): 経路計画のための深層強化学習の創出
- Authors: Thanh Thi Nguyen, Saeid Nahavandi, Imran Razzak, Dung Nguyen, Nhat Truong Pham, Quoc Viet Hung Nguyen,
- Abstract要約: 深部強化学習(DRL)は、自律エージェントが最適なナビゲーション戦略を学べる強力な方法として登場した。
本調査では、従来のアプローチの概要と、経路計画タスクに適用されたDRLの最近の進歩について概観する。
調査は、主要なオープンな課題を特定し、将来的な研究の道筋を概説することで締めくくっている。
- 参考スコア(独自算出の注目度): 27.08547928141541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing demand for autonomous systems in complex and dynamic environments has driven significant research into intelligent path planning methodologies. For decades, graph-based search algorithms, linear programming techniques, and evolutionary computation methods have served as foundational approaches in this domain. Recently, deep reinforcement learning (DRL) has emerged as a powerful method for enabling autonomous agents to learn optimal navigation strategies through interaction with their environments. This survey provides a comprehensive overview of traditional approaches as well as the recent advancements in DRL applied to path planning tasks, focusing on autonomous vehicles, drones, and robotic platforms. Key algorithms across both conventional and learning-based paradigms are categorized, with their innovations and practical implementations highlighted. This is followed by a thorough discussion of their respective strengths and limitations in terms of computational efficiency, scalability, adaptability, and robustness. The survey concludes by identifying key open challenges and outlining promising avenues for future research. Special attention is given to hybrid approaches that integrate DRL with classical planning techniques to leverage the benefits of both learning-based adaptability and deterministic reliability, offering promising directions for robust and resilient autonomous navigation.
- Abstract(参考訳): 複雑・動的環境における自律システムへの需要が増大し、インテリジェントパス計画手法に関する重要な研究が進められた。
グラフベースの探索アルゴリズム、線形プログラミング手法、進化的計算手法は、この領域の基本的なアプローチとして何十年も使われてきた。
近年,自律エージェントが環境とのインタラクションを通じて最適なナビゲーション戦略を学習するための強力な手法として,深層強化学習(DRL)が登場している。
この調査は、従来のアプローチの包括的概要と、自律走行車、ドローン、ロボットプラットフォームに焦点を当てた経路計画タスクに適用されたDRLの最近の進歩を提供する。
従来のパラダイムと学習ベースのパラダイムの両方で重要なアルゴリズムが分類され、そのイノベーションと実践的な実装が強調されている。
これに続いて、計算効率、スケーラビリティ、適応性、堅牢性の観点から、それぞれの強みと限界について徹底的に議論する。
調査は、主要なオープンな課題を特定し、将来的な研究の道筋を概説することで締めくくっている。
DRLと古典的な計画手法を統合するハイブリッドアプローチは、学習に基づく適応性と決定論的信頼性の両方の利点を活用し、堅牢でレジリエントな自律ナビゲーションのための有望な方向性を提供する。
関連論文リスト
- Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [55.78505925402658]
車両ルーティング問題(VRP)は、トラベリングセールスパーソン問題の延長であり、進化的最適化における基本的なNPハードチャレンジである。
遺伝的アルゴリズムによってさらに最適化された初期解を迅速に生成するために、強化学習エージェント(事前インスタンスで訓練された)を使用した新しい最適化フレームワークを導入する。
例えば、EARLIは1秒以内に500カ所の車両ルーティングを処理し、同じソリューション品質の現在のソルバよりも10倍高速で、リアルタイムやインタラクティブなルーティングのようなアプリケーションを可能にする。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - A Systematic Decade Review of Trip Route Planning with Travel Time Estimation based on User Preferences and Behavior [0.0]
本稿では,人工知能(AI)を用いた適応旅行経路計画と旅行時間推定の進歩を体系的に検討する。
機械学習(ML)、強化学習(RL)、グラフニューラルネットワーク(GNN)を含む確立されたAI技術
論文は、AIを活用して効率的で透明で持続可能なナビゲーションシステムを構築するための推奨事項で締めくくっている。
論文 参考訳(メタデータ) (2025-03-30T15:41:44Z) - Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures [9.21746609806009]
インテリジェントトランスポーテーションシステム(ITS)の複雑さは、エッジサーバ、車両ノード、UAVなどの外部インフラストラクチャへの計算オフロードに大きな関心を惹き付けている。
深部強化学習(DRL)による車両エッジコンピューティング(VEC)用オフロードの最近の進歩
学習パラダイム(シングルエージェント、マルチエージェントなど)、システムアーキテクチャ(集中型、分散型、階層型)、最適化目標(レイテンシ、エネルギー、公正性など)に基づいて、既存の作業の分類と比較を行う。
論文 参考訳(メタデータ) (2025-02-10T19:02:20Z) - Research on Autonomous Robots Navigation based on Reinforcement Learning [13.559881645869632]
我々は、経路計画と意思決定プロセスを最適化するために、Deep Q Network (DQN) と Proximal Policy Optimization (PPO) モデルを使用します。
様々な複雑なシナリオにおいて,これらのモデルの有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2024-07-02T00:44:06Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Constrained Reinforcement Learning for Robotics via Scenario-Based
Programming [64.07167316957533]
DRLをベースとしたエージェントの性能を最適化し,その動作を保証することが重要である。
本稿では,ドメイン知識を制約付きDRLトレーニングループに組み込む新しい手法を提案する。
我々の実験は、専門家の知識を活用するために我々のアプローチを用いることで、エージェントの安全性と性能が劇的に向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T07:19:38Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Experience-Based Heuristic Search: Robust Motion Planning with Deep
Q-Learning [0.0]
本稿では,Deep Q-Networkの形式でのエクスペリエンスを,探索アルゴリズムの最適ポリシとして統合する方法について述べる。
本手法は、自動運転車分野における強化学習に基づく計画の適用性について、さらなる研究を奨励する可能性がある。
論文 参考訳(メタデータ) (2021-02-05T12:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。