Fugu-MT 論文翻訳(概要): Learning to Drift in Extreme Turning with Active Exploration and Gaussian Process Based MPC

論文の概要: Learning to Drift in Extreme Turning with Active Exploration and Gaussian Process Based MPC

arxiv url: http://arxiv.org/abs/2410.05740v2
Date: Sun, 11 May 2025 04:04:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-13 20:21:48.687918
Title: Learning to Drift in Extreme Turning with Active Exploration and Gaussian Process Based MPC
Title（参考訳）: アクティブ探索とガウス過程に基づくMPCによる極端旋回におけるドリフト学習
Authors: Guoqiang Wu, Cheng Hu, Wangjia Weng, Zhouheng Li, Yonghao Fu, Lei Xie, Hongye Su,
Abstract要約: レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角につながり、車両制御にとって重要な課題である。モデル予測制御(MPC)とガウス過程回帰(GPR)を統合するモデル補正ドリフトコントローラを提案する。 GPRは、ドリフト平衡解法とMPC最適化過程の両方において、車両モデルのミスマッチを補正するために使用される。
参考スコア（独自算出の注目度）: 12.133328085287497
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Extreme cornering in racing often leads to large sideslip angles, presenting a significant challenge for vehicle control. Conventional vehicle controllers struggle to manage this scenario, necessitating the use of a drifting controller. However, the large sideslip angle in drift conditions introduces model mismatch, which in turn affects control precision. To address this issue, we propose a model correction drift controller that integrates Model Predictive Control (MPC) with Gaussian Process Regression (GPR). GPR is employed to correct vehicle model mismatches during both drift equilibrium solving and the MPC optimization process. Additionally, the variance from GPR is utilized to actively explore different cornering drifting velocities, aiming to minimize trajectory tracking errors. The proposed algorithm is validated through simulations on the Simulink-Carsim platform and experiments with a 1:10 scale RC vehicle. In the simulation, the average lateral error with GPR is reduced by 52.8% compared to the non-GPR case. Incorporating exploration further decreases this error by 27.1%. The velocity tracking Root Mean Square Error (RMSE) also decreases by 10.6% with exploration. In the RC car experiment, the average lateral error with GPR is 36.7% lower, and exploration further leads to a 29.0% reduction. Moreover, the velocity tracking RMSE decreases by 7.2% with the inclusion of exploration.
Abstract（参考訳）: レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角につながり、車両制御にとって重要な課題である。従来の車両制御装置はこのシナリオを管理するのに苦労し、ドリフトコントローラを使用する必要がある。しかし、ドリフト条件における大きなサイドリップ角はモデルミスマッチを導入し、制御精度に影響を及ぼす。本稿では,モデル予測制御(MPC)とガウスプロセス回帰(GPR)を統合したモデル補正ドリフトコントローラを提案する。 GPRは、ドリフト平衡解法とMPC最適化過程の両方において、車両モデルのミスマッチを補正するために使用される。さらに、GPRからのばらつきを利用して、軌跡追跡誤差を最小限に抑えるために、異なるコーナードリフト速度を積極的に探索する。提案アルゴリズムはSimulink-Carsimプラットフォーム上でのシミュレーションと1:10スケールのRC車両による実験により検証される。シミュレーションでは、非GPRの場合と比較して、GPRによる平均横誤差は52.8%減少する。探査を組み込むと、この誤差はさらに27.1%減少する。ルート平均角誤差(RMSE)も探索によって10.6%減少している。 RCカー実験では、GPRによる平均横誤差は36.7%低くなり、さらに探索によって29.0%の減少につながる。さらに、速度追跡RMSEは探査を含むと7.2%減少する。

関連論文リスト

Physics-informed Neural-operator Predictive Control for Drag Reduction in Turbulent Flows [109.99020160824553]
乱流のモデリングと制御のための効率的な深部強化学習フレームワークを提案する。予測制御(PC)のためのモデルベースRLであり、乱流制御のためのポリシとオブザーバモデルの両方を共同で学習する。その結果, PINO-PCは, バルク速度レイノルズ数15,000で39.0%の抗力低下を達成し, 従来の流体制御法を32%以上上回った。
論文参考訳（メタデータ） (2025-10-03T00:18:26Z)
SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning [99.645427839457]
セルフプレイ批判(Self-Play Critic、SPC)は、対戦型セルフプレイゲームを通じて推論ステップを評価する能力を進化させる新しいアプローチである。 SPCは、ベースモデルの2つのコピーを微調整して、2つの役割、すなわち「スニーキージェネレータ」と「批判的」を演じる。
論文参考訳（メタデータ） (2025-04-27T08:45:06Z)
Hovering Flight of Soft-Actuated Insect-Scale Micro Aerial Vehicles using Deep Reinforcement Learning [25.353235604712562]
ソフトアクチュレートされた昆虫型マイクロエアロビー(IMAV)は、堅牢で計算効率のよい制御装置を設計する上で、ユニークな課題を生んでいる。本稿では、システムの遅延と不確実性に対処する深層強化学習(RL)コントローラを設計する。このコントローラは、それぞれ720 mgと850 mgの2つの異なる昆虫スケールの空中ロボットに展開する。
論文参考訳（メタデータ） (2025-02-17T22:45:59Z)
Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文参考訳（メタデータ） (2024-12-11T06:35:18Z)
Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-17T11:47:56Z)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳（メタデータ） (2024-09-25T06:48:25Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving [2.382388777981433]
本稿では, 自律走行における3次元物体検出の高速化を目的としたkan-RCBEVDepth法を提案する。我々のユニークなBird’s Eye Viewベースのアプローチは、検出精度と効率を大幅に改善します。コードはurlhttps://www.laitiamo.com/laitiamo/RCBEVDepth-KANでリリースされる。
論文参考訳（メタデータ） (2024-08-04T16:54:49Z)
Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
運動プランナー(MP)は複雑な都市環境における安全なナビゲーションに不可欠である。最近リリースされたMPベンチマークであるnuPlanは、クローズドループシミュレーションロジックで現実世界の駆動ログを拡張することで、この制限に対処している。本稿では,モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverを提案する。
論文参考訳（メタデータ） (2024-06-15T18:53:45Z)
A Tricycle Model to Accurately Control an Autonomous Racecar with Locked Differential [71.53284767149685]
自動オープンホイールレースカーの側面力学に対するロックディファレンシャルの影響をモデル化するための新しい定式化を提案する。本稿では,マイクロステップの離散化手法を用いて,動的に線形化し,実時間実装に適した予測を行う。
論文参考訳（メタデータ） (2023-12-22T16:29:55Z)
Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文参考訳（メタデータ） (2023-12-11T14:27:10Z)
ASV Station Keeping under Wind Disturbances using Neural Network Simulation Error Minimization Model Predictive Control [5.039813366558306]
本研究では,ニューラルネットワークシミュレーション誤差最小化(NNSEM-MPC)を用いたモデル予測制御器を提案する。実行速度の面では、提案されたNSEM-MPCは、他のMPCコントローラよりも少なくとも36%高速である。
論文参考訳（メタデータ） (2023-10-11T20:55:13Z)
Rule-Based Error Detection and Correction to Operationalize Movement Trajectory Classification [1.192247515575942]
動作軌跡プラットフォームに組み込むためのモデルの誤り訂正と検出を行う,ニューロシンボリックなルールベースのフレームワークを提供する。最大0.984の誤差を予測するためのF1スコア、分布外精度の大幅な向上(ゼロショット精度のSOTAよりも8.51%向上)、SOTAモデルよりも精度の向上を示す。
論文参考訳（メタデータ） (2023-08-28T01:57:38Z)
Tuning Path Tracking Controllers for Autonomous Cars Using Reinforcement Learning [0.0]
本稿では,自動運転車のための強化学習(Reinforcement Learning, RL)に基づく適応経路追跡制御システムを提案する。トラッカーのチューニングは、学習されたQラーニングアルゴリズムを用いて、横方向および操舵軌道誤差を最小化する。
論文参考訳（メタデータ） (2023-01-09T14:17:12Z)
Robust, High-Rate Trajectory Tracking on Insect-Scale Soft-Actuated Aerial Robots with Deep-Learned Tube MPC [0.0]
サブグラムMAV (0.7 グラム) であるMIT SoftFly 上でのアジャイルで効率的な軌道追跡手法を提案する。我々の戦略は、適応型姿勢制御器と、軌跡追跡堅牢管モデル予測制御器(RTMPC)を模倣する訓練されたニューラルネットワークポリシーを組み合わせたカスケード制御方式を用いている。我々は,本手法を実験的に評価し,より困難な操作でもルート平均角誤差を1.8cm以下に抑え,従来の作業に比べて最大位置誤差を60%低減し,大きな外乱に対する堅牢性を実証した。
論文参考訳（メタデータ） (2022-09-20T21:30:16Z)
Motion Planning and Control for Multi Vehicle Autonomous Racing at High Speeds [100.61456258283245]
本稿では,自律走行のための多層移動計画と制御アーキテクチャを提案する。提案手法はダララのAV-21レースカーに適用され、楕円形のレーストラックで25$m/s2$まで加速試験された。
論文参考訳（メタデータ） (2022-07-22T15:16:54Z)
Collision-Free Navigation using Evolutionary Symmetrical Neural Networks [0.0]
本稿では、反応衝突回避のための進化的ニューラルネットワークを用いた以前の研究を拡張した。我々は、対称ニューラルネットワークと呼ばれる新しい手法を提案している。この手法は,ネットワーク重み間の制約を強制することにより,モデルの性能を向上させる。
論文参考訳（メタデータ） (2022-03-29T13:02:14Z)
SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文参考訳（メタデータ） (2021-04-04T03:17:42Z)
Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文参考訳（メタデータ） (2020-10-30T22:06:05Z)
Robust Quadrupedal Locomotion on Sloped Terrains: A Linear Policy Approach [3.752600874088677]
私たちは、四足歩行ロボットStochに2ドル(約2万2000円)のリニアポリシーを使っています。特に、エンドフット軌道のパラメータは、胴体方向と地形傾斜を入力として取る線形フィードバックポリシーによって形成される。結果として生じる歩行は、地形の斜面の変動や外部のプッシュに対して堅牢である。
論文参考訳（メタデータ） (2020-10-30T16:02:08Z)
Integrating Deep Reinforcement Learning with Model-based Path Planners for Automated Driving [0.0]
本稿では、経路計画管を視覚ベースのDRLフレームワークに統合するためのハイブリッドアプローチを提案する。要約すると、DRLエージェントは、パスプランナーのウェイポイントをできるだけ近くに追従するように訓練される。実験の結果,提案手法は経路を計画し,ランダムに選択した起点-終点間を移動可能であることがわかった。
論文参考訳（メタデータ） (2020-02-02T17:10:19Z)
Reinforcement Learning Based Vehicle-cell Association Algorithm for Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文参考訳（メタデータ） (2020-01-22T08:51:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。