論文の概要: Learning-based Preference Prediction for Constrained Multi-Criteria
Path-Planning
- arxiv url: http://arxiv.org/abs/2108.01080v1
- Date: Mon, 2 Aug 2021 17:13:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 14:05:33.147972
- Title: Learning-based Preference Prediction for Constrained Multi-Criteria
Path-Planning
- Title(参考訳): 制約付きマルチクリトリアパスプラニングの学習による予測
- Authors: Kevin Osanlou, Christophe Guettier, Andrei Bursuc, Tristan Cazenave
and Eric Jacopin
- Abstract要約: 自動地上車両(AGV)の制約された経路計画法はそのような適用例である。
我々は、ニューラルネットワークモデルをトレーニングして、オフラインシミュレーションによって得られた知識を活用し、不確実な基準を予測する。
私たちはこのモデルをパスプランナに統合し、オンラインの問題を解決することができます。
- 参考スコア(独自算出の注目度): 12.457788665461312
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Learning-based methods are increasingly popular for search algorithms in
single-criterion optimization problems. In contrast, for multiple-criteria
optimization there are significantly fewer approaches despite the existence of
numerous applications. Constrained path-planning for Autonomous Ground Vehicles
(AGV) is one such application, where an AGV is typically deployed in disaster
relief or search and rescue applications in off-road environments. The agent
can be faced with the following dilemma : optimize a source-destination path
according to a known criterion and an uncertain criterion under operational
constraints. The known criterion is associated to the cost of the path,
representing the distance. The uncertain criterion represents the feasibility
of driving through the path without requiring human intervention. It depends on
various external parameters such as the physics of the vehicle, the state of
the explored terrains or weather conditions. In this work, we leverage
knowledge acquired through offline simulations by training a neural network
model to predict the uncertain criterion. We integrate this model inside a
path-planner which can solve problems online. Finally, we conduct experiments
on realistic AGV scenarios which illustrate that the proposed framework
requires human intervention less frequently, trading for a limited increase in
the path distance.
- Abstract(参考訳): 単一基準最適化問題における探索アルゴリズムでは,学習に基づく手法がますます普及している。
対照的に、多重基準最適化には、多くのアプリケーションが存在するにもかかわらず、アプローチが著しく少ない。
自律地上車両(AGV)のための制約された経路計画(Constrained path-planning for autonomous Ground Vehicles,AGV)は、一般に、災害救助や災害救助の目的で、オフロード環境においてAGVが展開される。
エージェントは以下のジレンマに直面することができる: 既知の基準に従ってソース決定経路を最適化し、運用上の制約の下で不確実な基準を満たす。
既知の基準は、距離を表すパスのコストに関連付けられている。
不確かな基準は、人間の介入を必要とせずに経路を走行する可能性を示す。
これは、車両の物理、探索された地形の状態、気象条件など、様々な外部パラメータに依存する。
本研究では,オフラインシミュレーションによって得られた知識を,不確実性を予測するためにニューラルネットワークモデルをトレーニングすることで活用する。
このモデルをパスプランナーに統合し、オンラインで問題を解決します。
最後に,現実的なAGVシナリオの実験を行い,提案手法では人的介入の頻度を低くし,経路距離を限定的に増加させる。
関連論文リスト
- Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds [59.875550175217874]
本稿では,オンラインとオフラインのRL設定において,モデルベース強化学習方式が強い後悔とサンプル境界を実現することを示す。
我々のアルゴリズムは単純で、かなり標準的であり、実際にRLの文献で広く研究されている。
論文 参考訳(メタデータ) (2024-08-16T19:52:53Z) - Learning-Aided Warmstart of Model Predictive Control in Uncertain
Fast-Changing Traffic [2.0965639599405366]
我々は、ネットワークベースのマルチモーダル予測器を用いて、自律走行車軌道の提案を生成する。
このアプローチにより,複数の局所最小値の同定が可能となり,初期推定精度が向上する。
我々はモンテカルロシミュレーションによるアプローチを異なるシナリオで検証する。
論文 参考訳(メタデータ) (2023-10-04T16:00:21Z) - Integrating Higher-Order Dynamics and Roadway-Compliance into
Constrained ILQR-based Trajectory Planning for Autonomous Vehicles [3.200238632208686]
軌道計画は、自動運転車のグローバルな最適ルートを作成することを目的としている。
既存の自転車キネマティックモデルを用いた実装では、制御可能な軌道は保証できない。
このモデルを、曲率と長手ジャークの1階および2階微分を含む高階項で拡張する。
論文 参考訳(メタデータ) (2023-09-25T22:30:18Z) - Dual Formulation for Chance Constrained Stochastic Shortest Path with
Application to Autonomous Vehicle Behavior Planning [3.655021726150368]
制約最短経路問題(Constrained Shortest Path problem, C-SSP)は、特定の種類の運用制約下での環境における計画の定式化である。
この研究の最初の貢献は、Chance-Constrained Policyの正確な整数線型定式化である。
第三に、CC-SSP形式は、複数の時間ステップにまたがる制約を考慮するために一般化可能であることを示す。
論文 参考訳(メタデータ) (2023-02-25T16:40:00Z) - Interactively Learning Preference Constraints in Linear Bandits [100.78514640066565]
我々は、既知の報酬と未知の制約で逐次意思決定を研究する。
応用として,運転シミュレーションにおいて,人間の嗜好を表現するための学習制約を検討する。
論文 参考訳(メタデータ) (2022-06-10T17:52:58Z) - Offline Stochastic Shortest Path: Learning, Evaluation and Towards
Optimality [57.91411772725183]
本稿では,状態空間と動作空間が有限である場合のオフライン最短経路問題について考察する。
オフラインポリシ評価(OPE)とオフラインポリシ学習タスクの両方を扱うための,シンプルな値ベースアルゴリズムを設計する。
これらの単純なアルゴリズムの解析は、極小値に近い最悪のケース境界を示唆する強いインスタンス依存境界をもたらす。
論文 参考訳(メタデータ) (2022-06-10T07:44:56Z) - Motion Planning for Autonomous Vehicles in the Presence of Uncertainty
Using Reinforcement Learning [0.0]
不確実性の下での運動計画は、自動運転車の開発における主要な課題の1つである。
最悪の事例を最適化して不確実性を管理するための強化学習に基づくソリューションを提案する。
提案手法は従来のRLアルゴリズムよりもはるかに優れた動作計画行動を示し,人間の運転スタイルと相容れない動作を示す。
論文 参考訳(メタデータ) (2021-10-01T20:32:25Z) - Optimal Solving of Constrained Path-Planning Problems with Graph
Convolutional Networks and Optimized Tree Search [12.457788665461312]
本稿では,機械学習モデルと最適解法を併用したハイブリッド問題解決プランナを提案する。
我々は現実的なシナリオで実験を行い、GCNのサポートにより、より難しい問題に対して、大幅なスピードアップとスムーズなスケーリングが可能になることを示す。
論文 参考訳(メタデータ) (2021-08-02T16:53:21Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Can Autonomous Vehicles Identify, Recover From, and Adapt to
Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。
インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。
提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。
分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文 参考訳(メタデータ) (2020-06-26T11:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。