Fugu-MT 論文翻訳(概要): Learning Model Predictive Control for Competitive Autonomous Racing

論文の概要: Learning Model Predictive Control for Competitive Autonomous Racing

arxiv url: http://arxiv.org/abs/2005.00826v1
Date: Sat, 2 May 2020 13:05:31 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-07 12:18:31.789746
Title: Learning Model Predictive Control for Competitive Autonomous Racing
Title（参考訳）: 競争的自律レースのための学習モデル予測制御
Authors: Lukas Brunke
Abstract要約: この論文の目標は、学習モデル予測コントローラ(LMPC)を設計し、複数のエージェントが事前に定義されたレーストラックでリアルタイムに競い合うようにすることである。この論文は、既存の単一エージェントの定式化における2つの欠点に対処する。
参考スコア（独自算出の注目度）: 2.0305676256390934
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The goal of this thesis is to design a learning model predictive controller (LMPC) that allows multiple agents to race competitively on a predefined race track in real-time. This thesis addresses two major shortcomings in the already existing single-agent formulation. Previously, the agent determines a locally optimal trajectory but does not explore the state space, which may be necessary for overtaking maneuvers. Additionally, obstacle avoidance for LMPC has been achieved in the past by using a non-convex terminal set, which increases the complexity for determining a solution to the optimization problem. The proposed algorithm for multi-agent racing explores the state space by executing the LMPC for multiple different initializations, which yields a richer terminal safe set. Furthermore, a new method for selecting states in the terminal set is developed, which keeps the convexity for the terminal safe set and allows for taking suboptimal states.
Abstract（参考訳）: この論文の目標は、学習モデル予測コントローラ(LMPC)を設計し、複数のエージェントが事前に定義されたレーストラックでリアルタイムに競い合うようにすることである。この論文は、既存の単一エージェントの定式化における2つの大きな欠点に対処する。以前は、エージェントは局所的に最適な軌道を決定するが、操作を行うのに必要な状態空間を探索しない。さらに,非凸終端集合を用いてLMPCの障害物回避を実現しており,最適化問題の解を決定する際の複雑性が増大している。提案するマルチエージェントレースアルゴリズムは,複数の初期化に対してLMPCを実行することで状態空間を探索し,よりリッチな端末セーフセットを生成する。さらに、端末セーフセットの凸性を保ち、最適下状態を取ることができる、端末セット内の状態を選択する新しい方法を開発した。

関連論文リスト

ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。学習タスクを再編成し、慣性参照からの残留偏差を予測する。 NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文参考訳（メタデータ） (2025-10-09T17:59:36Z)
Online Decision-Focused Learning [63.83903681295497]
意思決定中心学習(DFL)は、意思決定タスクで出力が使用される予測モデルを訓練するパラダイムとして、ますます人気が高まっている。対象関数が時間とともに進化しない動的環境におけるDFLについて検討する。決定空間が単純空間であるときと一般有界凸ポリトープであるときの両方において、期待される動的後悔の限界を確立する。
論文参考訳（メタデータ） (2025-05-19T10:40:30Z)
An End-to-End Smart Predict-then-Optimize Framework for Vehicle Relocation Problems in Large-Scale Vehicle Crowd Sensing [10.74565749809106]
車両システムは、旅行要求やルートの性質により、しばしば偏りのあるカバレッジを示す。我々は最適化を予測に統合することで、エンドツーエンドのSmart Predict-then-optize (SPO) フレームワークを開発する。このフレームワークは上流の予測エラーではなく、タスク固有のマッチングによって訓練される。
論文参考訳（メタデータ） (2024-11-27T15:16:22Z)
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front [9.04360155372014]
制約付きMORLは制約付きポリシー最適化とMORLのシームレスなブリッジである。我々のアルゴリズムは、離散的かつ連続的な制御タスクにおいて、ハイパーボリューム、期待されるユーティリティ、およびスパーシリティという観点でより一貫性があり、優れた性能を達成する。
論文参考訳（メタデータ） (2024-10-03T06:13:56Z)
OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。 OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文参考訳（メタデータ） (2024-09-14T07:44:22Z)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳（メタデータ） (2024-05-26T05:38:50Z)
Learning-Aided Warmstart of Model Predictive Control in Uncertain Fast-Changing Traffic [2.0965639599405366]
我々は、ネットワークベースのマルチモーダル予測器を用いて、自律走行車軌道の提案を生成する。このアプローチにより,複数の局所最小値の同定が可能となり,初期推定精度が向上する。我々はモンテカルロシミュレーションによるアプローチを異なるシナリオで検証する。
論文参考訳（メタデータ） (2023-10-04T16:00:21Z)
CACTO: Continuous Actor-Critic with Trajectory Optimization -- Towards global optimality [5.0915256711576475]
本稿では,Tlayy(TO)とReinforcement Learning(RL)を1つの軌道で組み合わせた,動的システムの連続制御のための新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-11-12T10:16:35Z)
Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting [61.02295959343446]
この研究はまず、相互作用モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。我々は、回帰と不確実性推定の両方を行うために、元の置換同変不確かさ推定器を備えた一般的なCU対応回帰フレームワークを構築した。提案するフレームワークを,プラグインモジュールとして現在のSOTAマルチエージェント軌道予測システムに適用する。
論文参考訳（メタデータ） (2022-07-11T21:17:41Z)
Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。このアプローチは多くの実装と最適化の課題をもたらします。提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文参考訳（メタデータ） (2021-03-18T14:26:26Z)
Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。 ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文参考訳（メタデータ） (2021-03-18T08:47:56Z)
Modular Deep Reinforcement Learning for Continuous Motion Planning with Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。 LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文参考訳（メタデータ） (2021-02-24T01:11:25Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)
Trajectory Optimization for Nonlinear Multi-Agent Systems using Decentralized Learning Model Predictive Control [5.2647625557619815]
非線形疎結合力学と結合状態制約を持つマルチエージェントシステムに対する学習モデル予測制御に基づく分散化最小時間軌道最適化手法を提案する。このフレームワークは,タスク実行の各イテレーションにおけるエージェント間の通信を不要とし,永続的実現性,有限時間閉ループ収束性,グローバルシステムのタスク反復による非遅延性能を保証する。
論文参考訳（メタデータ） (2020-04-02T23:04:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。