Fugu-MT 論文翻訳(概要): Deep Deterministic Path Following

論文の概要: Deep Deterministic Path Following

arxiv url: http://arxiv.org/abs/2104.06014v1
Date: Tue, 13 Apr 2021 08:30:53 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-14 22:02:06.433594
Title: Deep Deterministic Path Following
Title（参考訳）: 深い決定論的経路
Authors: Georg Hess and William Ljungbergh
Abstract要約: 本稿では, シミュレーション車両の縦・横方向制御のためのDeep Deterministic Policy Gradient (DDPG) アルゴリズムをデプロイし, 追従課題を解決する。 DDPGエージェントはPyTorchを使用して実装され、Pythonで作成されたカスタムキネマティック自転車環境でトレーニングおよび評価された。その結果, エージェントは, 速度誤差を最小限に抑えるためにアクセラレーションに適応するだけでなく, クロストラック誤差の少ないポリシーを学習できることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper deploys the Deep Deterministic Policy Gradient (DDPG) algorithm for longitudinal and lateral control of a simulated car to solve a path following task. The DDPG agent was implemented using PyTorch and trained and evaluated on a custom kinematic bicycle environment created in Python. The performance was evaluated by measuring cross-track error and velocity error, relative to a reference path. Results show how the agent can learn a policy allowing for small cross-track error, as well as adapting the acceleration to minimize the velocity error.
Abstract（参考訳）: 本稿では, シミュレーション車両の縦・横方向制御のためのDeep Deterministic Policy Gradient (DDPG) アルゴリズムをデプロイし, 追従課題を解決する。 DDPGエージェントはPyTorchを使用して実装され、Pythonで作られたカスタムキネマティック自転車環境上で訓練され評価された。この性能は, 基準経路に対するクロストラック誤差と速度誤差を測定して評価した。その結果, エージェントは, 速度誤差を最小限に抑えるためにアクセラレーションに適応するだけでなく, クロストラック誤差の少ないポリシーを学習できることを示す。

関連論文リスト

Calibrating Adaptive Smoothing Methods for Freeway Traffic Reconstruction [3.9440066871968447]
適応平滑化法(Adaptive smoothing method, ASM)は、交通状態の再構築に広く用いられている手法である。本稿では,現実の地上真実データを用いたエンドツーエンドキャリブレーションを特徴とするASMのPython実装について述べる。
論文参考訳（メタデータ） (2026-02-02T13:12:39Z)
Enhancing Path Planning Performance through Image Representation Learning of High-Dimensional Configuration Spaces [0.4143603294943439]
障害物のある未知のシーンにおける経路計画タスクを高速化する新しい手法を提案する。高速探索ランダムツリーアルゴリズムを用いて,衝突のない経路の経路点分布を近似した。本実験は,臨界時間制約下での経路計画タスクを高速化する有望な結果を実証する。
論文参考訳（メタデータ） (2025-01-11T21:14:52Z)
Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-17T11:47:56Z)
Learning to Race in Extreme Turning Scene with Active Exploration and Gaussian Process Regression-based MPC [12.133328085287497]
レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角を誘導し、車両制御において恐ろしい挑戦となる。本稿では,AEDGPR(Active Exploration with Double GPR)システムを提案する。提案アルゴリズムは,Simulink-Carsimプラットフォーム上でのシミュレーションと,1/10スケールのRC車両を用いた実験により検証された。
論文参考訳（メタデータ） (2024-10-08T06:56:51Z)
Autonomous Navigation of Unmanned Vehicle Through Deep Reinforcement Learning [1.3725832537448668]
本稿では,アッカーマンロボットのモデルとDDPGアルゴリズムの構造と応用について詳述する。その結果、DDPGアルゴリズムは経路計画タスクにおいて従来のディープQネットワーク(DQN)およびダブルディープQネットワーク(DDQN)アルゴリズムよりも優れていた。
論文参考訳（メタデータ） (2024-07-18T05:18:59Z)
Unsupervised Domain Adaptation for Self-Driving from Past Traversal Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。実世界のデータセットの実験では、大幅な改善が示されている。
論文参考訳（メタデータ） (2023-09-21T15:00:31Z)
Waypoint-Based Imitation Learning for Robotic Manipulation [56.4287610994102]
ウェイポイントラベリングは不特定であり、追加の人的監督が必要である。模倣学習のためのAWE(Automatic Waypoint extract)を提案する。 AWEは、最先端のアルゴリズムの成功率を、シミュレーションで25%、実世界のバイマニュアル操作タスクで4-28%向上させることができる。
論文参考訳（メタデータ） (2023-07-26T17:45:55Z)
Efficient Ground Vehicle Path Following in Game AI [77.34726150561087]
本稿では,ゲームAIに適した地上車両の効率的な追従経路を提案する。提案したパスフォロワは,一対一シューティングゲームにおいて,様々なテストシナリオを通じて評価される。その結果,既存の経路と比較すると,立ち往生するイベントの総数が70%減少した。
論文参考訳（メタデータ） (2023-07-07T04:20:07Z)
Short Duration Traffic Flow Prediction Using Kalman Filtering [0.0]
調査は、ソバンバグ・モスク近郊のダッカのミルプル・ロードで行われた。ストリームには異質なトラフィックの混合が含まれており、予測の不確実性を示している。提案されたモデルの平均絶対パーセンテージ誤差(MAPE)は14.62であり、KFTモデルは合理的に予測できることを示している。
論文参考訳（メタデータ） (2022-08-06T00:30:47Z)
OctoPath: An OcTree Based Self-Supervised Learning Approach to Local Trajectory Planning for Mobile Robots [0.0]
我々は,エンコーダ・デコーダ・ディープニューラルネットワークであるOctoPathを導入し,エゴ車両の最適軌道を予測するための自己教師型訓練を行った。トレーニング中、OctoPathは、所定のトレーニングデータセット内の予測と手動で駆動するトラジェクトリ間のエラーを最小限にする。我々は,室内と屋外の異なる運転シナリオにおけるOctoPathの予測を,ベースラインハイブリッドA-Starアルゴリズムに対してベンチマークしながら評価した。
論文参考訳（メタデータ） (2021-06-02T07:10:54Z)
Multi-Agent Path Planning based on MPC and DDPG [14.793341914236166]
モデル予測制御(MPC)とDeep Deterministic Policy Gradient(DDPG)を組み合わせた新しいアルゴリズムを提案する。 ddpg with continuous action spaceは、ロボットに学習と自律的な意思決定機能を提供するように設計されている。航空母艦デッキや四角形などの不確定な環境でのシミュレーション実験にunity 3dを用いる。
論文参考訳（メタデータ） (2021-02-26T02:57:13Z)
POMP: Pomcp-based Online Motion Planning for active visual search in indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文参考訳（メタデータ） (2020-09-17T08:23:50Z)
Tracking Road Users using Constraint Programming [79.32806233778511]
本稿では,マルチオブジェクトトラッキング(MOT)問題のトラッキング・バイ・検出パラダイムに見られるデータアソシエーションフェーズに対する制約プログラミング(CP)アプローチを提案する。提案手法は車両追跡データを用いてテストし,UA-DETRACベンチマークの上位手法よりも優れた結果を得た。
論文参考訳（メタデータ） (2020-03-10T00:04:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。