論文の概要: Learning Model Predictive Control for Competitive Autonomous Racing
- arxiv url: http://arxiv.org/abs/2005.00826v1
- Date: Sat, 2 May 2020 13:05:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 12:18:31.789746
- Title: Learning Model Predictive Control for Competitive Autonomous Racing
- Title(参考訳): 競争的自律レースのための学習モデル予測制御
- Authors: Lukas Brunke
- Abstract要約: この論文の目標は、学習モデル予測コントローラ(LMPC)を設計し、複数のエージェントが事前に定義されたレーストラックでリアルタイムに競い合うようにすることである。
この論文は、既存の単一エージェントの定式化における2つの欠点に対処する。
- 参考スコア(独自算出の注目度): 2.0305676256390934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of this thesis is to design a learning model predictive controller
(LMPC) that allows multiple agents to race competitively on a predefined race
track in real-time. This thesis addresses two major shortcomings in the already
existing single-agent formulation. Previously, the agent determines a locally
optimal trajectory but does not explore the state space, which may be necessary
for overtaking maneuvers. Additionally, obstacle avoidance for LMPC has been
achieved in the past by using a non-convex terminal set, which increases the
complexity for determining a solution to the optimization problem. The proposed
algorithm for multi-agent racing explores the state space by executing the LMPC
for multiple different initializations, which yields a richer terminal safe
set. Furthermore, a new method for selecting states in the terminal set is
developed, which keeps the convexity for the terminal safe set and allows for
taking suboptimal states.
- Abstract(参考訳): この論文の目標は、学習モデル予測コントローラ(LMPC)を設計し、複数のエージェントが事前に定義されたレーストラックでリアルタイムに競い合うようにすることである。
この論文は、既存の単一エージェントの定式化における2つの大きな欠点に対処する。
以前は、エージェントは局所的に最適な軌道を決定するが、操作を行うのに必要な状態空間を探索しない。
さらに,非凸終端集合を用いてLMPCの障害物回避を実現しており,最適化問題の解を決定する際の複雑性が増大している。
提案するマルチエージェントレースアルゴリズムは,複数の初期化に対してLMPCを実行することで状態空間を探索し,よりリッチな端末セーフセットを生成する。
さらに、端末セーフセットの凸性を保ち、最適下状態を取ることができる、端末セット内の状態を選択する新しい方法を開発した。
関連論文リスト
- Learning Constrained Optimization with Deep Augmented Lagrangian Methods [60.94111369773497]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。
本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。
これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文 参考訳(メタデータ) (2024-03-06T04:43:22Z) - Learning-Aided Warmstart of Model Predictive Control in Uncertain
Fast-Changing Traffic [2.0965639599405366]
我々は、ネットワークベースのマルチモーダル予測器を用いて、自律走行車軌道の提案を生成する。
このアプローチにより,複数の局所最小値の同定が可能となり,初期推定精度が向上する。
我々はモンテカルロシミュレーションによるアプローチを異なるシナリオで検証する。
論文 参考訳(メタデータ) (2023-10-04T16:00:21Z) - Near-optimal Policy Identification in Active Reinforcement Learning [84.27592560211909]
AE-LSVI はカーネル化された最小二乗値 RL (LSVI) アルゴリズムの新しい変種であり、楽観主義と悲観主義を組み合わせて活発な探索を行う。
AE-LSVIは初期状態に対するロバスト性が必要な場合、様々な環境で他のアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-19T14:46:57Z) - CACTO: Continuous Actor-Critic with Trajectory Optimization -- Towards
global optimality [5.0915256711576475]
本稿では,Tlayy(TO)とReinforcement Learning(RL)を1つの軌道で組み合わせた,動的システムの連続制御のための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-12T10:16:35Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Trajectory Optimization for Nonlinear Multi-Agent Systems using
Decentralized Learning Model Predictive Control [5.2647625557619815]
非線形疎結合力学と結合状態制約を持つマルチエージェントシステムに対する学習モデル予測制御に基づく分散化最小時間軌道最適化手法を提案する。
このフレームワークは,タスク実行の各イテレーションにおけるエージェント間の通信を不要とし,永続的実現性,有限時間閉ループ収束性,グローバルシステムのタスク反復による非遅延性能を保証する。
論文 参考訳(メタデータ) (2020-04-02T23:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。