論文の概要: Deep Deterministic Path Following
- arxiv url: http://arxiv.org/abs/2104.06014v1
- Date: Tue, 13 Apr 2021 08:30:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 22:02:06.433594
- Title: Deep Deterministic Path Following
- Title(参考訳): 深い決定論的経路
- Authors: Georg Hess and William Ljungbergh
- Abstract要約: 本稿では, シミュレーション車両の縦・横方向制御のためのDeep Deterministic Policy Gradient (DDPG) アルゴリズムをデプロイし, 追従課題を解決する。
DDPGエージェントはPyTorchを使用して実装され、Pythonで作成されたカスタムキネマティック自転車環境でトレーニングおよび評価された。
その結果, エージェントは, 速度誤差を最小限に抑えるためにアクセラレーションに適応するだけでなく, クロストラック誤差の少ないポリシーを学習できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper deploys the Deep Deterministic Policy Gradient (DDPG) algorithm
for longitudinal and lateral control of a simulated car to solve a path
following task. The DDPG agent was implemented using PyTorch and trained and
evaluated on a custom kinematic bicycle environment created in Python. The
performance was evaluated by measuring cross-track error and velocity error,
relative to a reference path. Results show how the agent can learn a policy
allowing for small cross-track error, as well as adapting the acceleration to
minimize the velocity error.
- Abstract(参考訳): 本稿では, シミュレーション車両の縦・横方向制御のためのDeep Deterministic Policy Gradient (DDPG) アルゴリズムをデプロイし, 追従課題を解決する。
DDPGエージェントはPyTorchを使用して実装され、Pythonで作られたカスタムキネマティック自転車環境上で訓練され評価された。
この性能は, 基準経路に対するクロストラック誤差と速度誤差を測定して評価した。
その結果, エージェントは, 速度誤差を最小限に抑えるためにアクセラレーションに適応するだけでなく, クロストラック誤差の少ないポリシーを学習できることを示す。
関連論文リスト
- Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Waypoint-Based Imitation Learning for Robotic Manipulation [56.4287610994102]
ウェイポイントラベリングは不特定であり、追加の人的監督が必要である。
模倣学習のためのAWE(Automatic Waypoint extract)を提案する。
AWEは、最先端のアルゴリズムの成功率を、シミュレーションで25%、実世界のバイマニュアル操作タスクで4-28%向上させることができる。
論文 参考訳(メタデータ) (2023-07-26T17:45:55Z) - Efficient Ground Vehicle Path Following in Game AI [77.34726150561087]
本稿では,ゲームAIに適した地上車両の効率的な追従経路を提案する。
提案したパスフォロワは,一対一シューティングゲームにおいて,様々なテストシナリオを通じて評価される。
その結果,既存の経路と比較すると,立ち往生するイベントの総数が70%減少した。
論文 参考訳(メタデータ) (2023-07-07T04:20:07Z) - Short Duration Traffic Flow Prediction Using Kalman Filtering [0.0]
調査は、ソバンバグ・モスク近郊のダッカのミルプル・ロードで行われた。
ストリームには異質なトラフィックの混合が含まれており、予測の不確実性を示している。
提案されたモデルの平均絶対パーセンテージ誤差(MAPE)は14.62であり、KFTモデルは合理的に予測できることを示している。
論文 参考訳(メタデータ) (2022-08-06T00:30:47Z) - DeepScale: An Online Frame Size Adaptation Framework to Accelerate
Visual Multi-object Tracking [8.878656943106934]
DeepScaleは、追跡スループットを高速化するモデルに依存しないフレームサイズ選択アプローチである。
フレームサイズを実行時に適応させることで、トラッキング精度と速度の適切なトレードオフを見つけることができる。
最先端のトラッカーであるDeepScale++と比較して、DeepScaleの亜種であるDeepScale++は、適度な劣化だけで1.57倍の高速化を実現している。
論文 参考訳(メタデータ) (2021-07-22T00:12:58Z) - OctoPath: An OcTree Based Self-Supervised Learning Approach to Local
Trajectory Planning for Mobile Robots [0.0]
我々は,エンコーダ・デコーダ・ディープニューラルネットワークであるOctoPathを導入し,エゴ車両の最適軌道を予測するための自己教師型訓練を行った。
トレーニング中、OctoPathは、所定のトレーニングデータセット内の予測と手動で駆動するトラジェクトリ間のエラーを最小限にする。
我々は,室内と屋外の異なる運転シナリオにおけるOctoPathの予測を,ベースラインハイブリッドA-Starアルゴリズムに対してベンチマークしながら評価した。
論文 参考訳(メタデータ) (2021-06-02T07:10:54Z) - Multi-Agent Path Planning based on MPC and DDPG [14.793341914236166]
モデル予測制御(MPC)とDeep Deterministic Policy Gradient(DDPG)を組み合わせた新しいアルゴリズムを提案する。
ddpg with continuous action spaceは、ロボットに学習と自律的な意思決定機能を提供するように設計されている。
航空母艦デッキや四角形などの不確定な環境でのシミュレーション実験にunity 3dを用いる。
論文 参考訳(メタデータ) (2021-02-26T02:57:13Z) - Fusion of neural networks, for LIDAR-based evidential road mapping [3.065376455397363]
LIDARスキャンにおける道路検出に最適化された新しい畳み込みアーキテクチャであるRoadSegを紹介する。
RoadSegは、個々のLIDARポイントを道路に属するか、そうでないかを分類するために使用される。
そこで本研究では,連続した道路検出結果を融合する明らかな道路マッピングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-05T18:14:36Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z) - Road Network Metric Learning for Estimated Time of Arrival [93.0759529610483]
本稿では,ATA(Estimated Time of Arrival)のための道路ネットワークメトリックラーニングフレームワークを提案する。
本研究は,(1)走行時間を予測する主回帰タスク,(2)リンク埋め込みベクトルの品質向上のための補助的計量学習タスクの2つの構成要素から構成される。
提案手法は最先端モデルよりも優れており,その促進は少ないデータでコールドリンクに集中していることを示す。
論文 参考訳(メタデータ) (2020-06-24T04:45:14Z) - Tracking Road Users using Constraint Programming [79.32806233778511]
本稿では,マルチオブジェクトトラッキング(MOT)問題のトラッキング・バイ・検出パラダイムに見られるデータアソシエーションフェーズに対する制約プログラミング(CP)アプローチを提案する。
提案手法は車両追跡データを用いてテストし,UA-DETRACベンチマークの上位手法よりも優れた結果を得た。
論文 参考訳(メタデータ) (2020-03-10T00:04:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。