論文の概要: Deep Deterministic Path Following
- arxiv url: http://arxiv.org/abs/2104.06014v1
- Date: Tue, 13 Apr 2021 08:30:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 22:02:06.433594
- Title: Deep Deterministic Path Following
- Title(参考訳): 深い決定論的経路
- Authors: Georg Hess and William Ljungbergh
- Abstract要約: 本稿では, シミュレーション車両の縦・横方向制御のためのDeep Deterministic Policy Gradient (DDPG) アルゴリズムをデプロイし, 追従課題を解決する。
DDPGエージェントはPyTorchを使用して実装され、Pythonで作成されたカスタムキネマティック自転車環境でトレーニングおよび評価された。
その結果, エージェントは, 速度誤差を最小限に抑えるためにアクセラレーションに適応するだけでなく, クロストラック誤差の少ないポリシーを学習できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper deploys the Deep Deterministic Policy Gradient (DDPG) algorithm
for longitudinal and lateral control of a simulated car to solve a path
following task. The DDPG agent was implemented using PyTorch and trained and
evaluated on a custom kinematic bicycle environment created in Python. The
performance was evaluated by measuring cross-track error and velocity error,
relative to a reference path. Results show how the agent can learn a policy
allowing for small cross-track error, as well as adapting the acceleration to
minimize the velocity error.
- Abstract(参考訳): 本稿では, シミュレーション車両の縦・横方向制御のためのDeep Deterministic Policy Gradient (DDPG) アルゴリズムをデプロイし, 追従課題を解決する。
DDPGエージェントはPyTorchを使用して実装され、Pythonで作られたカスタムキネマティック自転車環境上で訓練され評価された。
この性能は, 基準経路に対するクロストラック誤差と速度誤差を測定して評価した。
その結果, エージェントは, 速度誤差を最小限に抑えるためにアクセラレーションに適応するだけでなく, クロストラック誤差の少ないポリシーを学習できることを示す。
関連論文リスト
- Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Learning to Race in Extreme Turning Scene with Active Exploration and Gaussian Process Regression-based MPC [12.133328085287497]
レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角を誘導し、車両制御において恐ろしい挑戦となる。
本稿では,AEDGPR(Active Exploration with Double GPR)システムを提案する。
提案アルゴリズムは,Simulink-Carsimプラットフォーム上でのシミュレーションと,1/10スケールのRC車両を用いた実験により検証された。
論文 参考訳(メタデータ) (2024-10-08T06:56:51Z) - Autonomous Navigation of Unmanned Vehicle Through Deep Reinforcement Learning [1.3725832537448668]
本稿では,アッカーマンロボットのモデルとDDPGアルゴリズムの構造と応用について詳述する。
その結果、DDPGアルゴリズムは経路計画タスクにおいて従来のディープQネットワーク(DQN)およびダブルディープQネットワーク(DDQN)アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-07-18T05:18:59Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Waypoint-Based Imitation Learning for Robotic Manipulation [56.4287610994102]
ウェイポイントラベリングは不特定であり、追加の人的監督が必要である。
模倣学習のためのAWE(Automatic Waypoint extract)を提案する。
AWEは、最先端のアルゴリズムの成功率を、シミュレーションで25%、実世界のバイマニュアル操作タスクで4-28%向上させることができる。
論文 参考訳(メタデータ) (2023-07-26T17:45:55Z) - Efficient Ground Vehicle Path Following in Game AI [77.34726150561087]
本稿では,ゲームAIに適した地上車両の効率的な追従経路を提案する。
提案したパスフォロワは,一対一シューティングゲームにおいて,様々なテストシナリオを通じて評価される。
その結果,既存の経路と比較すると,立ち往生するイベントの総数が70%減少した。
論文 参考訳(メタデータ) (2023-07-07T04:20:07Z) - Short Duration Traffic Flow Prediction Using Kalman Filtering [0.0]
調査は、ソバンバグ・モスク近郊のダッカのミルプル・ロードで行われた。
ストリームには異質なトラフィックの混合が含まれており、予測の不確実性を示している。
提案されたモデルの平均絶対パーセンテージ誤差(MAPE)は14.62であり、KFTモデルは合理的に予測できることを示している。
論文 参考訳(メタデータ) (2022-08-06T00:30:47Z) - OctoPath: An OcTree Based Self-Supervised Learning Approach to Local
Trajectory Planning for Mobile Robots [0.0]
我々は,エンコーダ・デコーダ・ディープニューラルネットワークであるOctoPathを導入し,エゴ車両の最適軌道を予測するための自己教師型訓練を行った。
トレーニング中、OctoPathは、所定のトレーニングデータセット内の予測と手動で駆動するトラジェクトリ間のエラーを最小限にする。
我々は,室内と屋外の異なる運転シナリオにおけるOctoPathの予測を,ベースラインハイブリッドA-Starアルゴリズムに対してベンチマークしながら評価した。
論文 参考訳(メタデータ) (2021-06-02T07:10:54Z) - Multi-Agent Path Planning based on MPC and DDPG [14.793341914236166]
モデル予測制御(MPC)とDeep Deterministic Policy Gradient(DDPG)を組み合わせた新しいアルゴリズムを提案する。
ddpg with continuous action spaceは、ロボットに学習と自律的な意思決定機能を提供するように設計されている。
航空母艦デッキや四角形などの不確定な環境でのシミュレーション実験にunity 3dを用いる。
論文 参考訳(メタデータ) (2021-02-26T02:57:13Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z) - Tracking Road Users using Constraint Programming [79.32806233778511]
本稿では,マルチオブジェクトトラッキング(MOT)問題のトラッキング・バイ・検出パラダイムに見られるデータアソシエーションフェーズに対する制約プログラミング(CP)アプローチを提案する。
提案手法は車両追跡データを用いてテストし,UA-DETRACベンチマークの上位手法よりも優れた結果を得た。
論文 参考訳(メタデータ) (2020-03-10T00:04:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。