論文の概要: Gradient Policy on "CartPole" game and its' expansibility to F1Tenth
Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2103.08396v1
- Date: Mon, 15 Mar 2021 14:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 13:50:22.585518
- Title: Gradient Policy on "CartPole" game and its' expansibility to F1Tenth
Autonomous Vehicles
- Title(参考訳): CartPole」ゲームにおけるグラデーション政策とF1Tenth自動運転車への拡張性
- Authors: Mingwei Shi
- Abstract要約: 政策勾配は環境に対する継続的な行動を評価する効果的な方法である。
最後に、カートポール上の棒の回転角と旋回時の自律車両の回転角を比較し、単純な運動力学モデルである自転車モデルを利用することは、これら2つのモデル間の類似性を発見することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Policy gradient is an effective way to estimate continuous action on the
environment. This paper, it about explaining the mathematical formula and code
implementation. In the end, comparing between the rotation angle of the stick
on CartPole , and the angle of the Autonomous vehicle when turning, and
utilizing the Bicycle Model, a simple Kinematic dynamic model, are the purpose
to discover the similarity between these two models, so as to facilitate the
model transfer from CartPole to the F1tenth Autonomous vehicle.
- Abstract(参考訳): 政策勾配は環境に対する継続的な行動を評価する効果的な方法である。
本稿では,数式とコード実装の説明について述べる。
最後に、CartPoleのスティックの回転角度と回転時の自動運転車の角度を比較し、単純なキネマティックダイナミックモデルである自転車モデルを活用することは、これらの2つのモデル間の類似性を発見し、CartPoleからF1tenth自動運転車へのモデル転送を容易にすることを目的としています。
関連論文リスト
- MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - Dyna-Style Learning with A Macroscopic Model for Vehicle Platooning in Mixed-Autonomy Traffic [8.199735228589766]
コネクテッド・自動運転車(CAV)のプラトゥーイングは、ハイウェイの近代化において重要な役割を担い、効率と安全性の向上に寄与する。
本稿では, スマートハイウェイにおける小隊化の重要性を考察し, 結合偏微分方程式 (PDE) と常微分方程式 (ODE) モデルを用いて検討する。
本研究は,小隊制御に適したDynaスタイルの計画学習フレームワークの開発に焦点をあてる。
論文 参考訳(メタデータ) (2024-05-03T12:44:52Z) - A Tricycle Model to Accurately Control an Autonomous Racecar with Locked
Differential [71.53284767149685]
自動オープンホイールレースカーの側面力学に対するロックディファレンシャルの影響をモデル化するための新しい定式化を提案する。
本稿では,マイクロステップの離散化手法を用いて,動的に線形化し,実時間実装に適した予測を行う。
論文 参考訳(メタデータ) (2023-12-22T16:29:55Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - Vehicle Dynamics Modeling for Autonomous Racing Using Gaussian Processes [0.0]
本稿では,自動走行における車両動力学の近似におけるGPモデルの適用性について,最も詳細な解析を行った。
人気のあるF1TENTHレーシングプラットフォームのための動的および拡張キネマティックモデルを構築した。
論文 参考訳(メタデータ) (2023-06-06T04:53:06Z) - CRAT-Pred: Vehicle Trajectory Prediction with Crystal Graph
Convolutional Neural Networks and Multi-Head Self-Attention [10.83642398981694]
CRAT-Predは、地図情報に依存しない軌道予測モデルである。
このモデルは非常に少ないモデルパラメータで最先端の性能を達成する。
さらに,車間の社会的相互作用を,測定可能なインタラクションスコアを表す重みによって学習できることを定量的に示す。
論文 参考訳(メタデータ) (2022-02-09T14:36:36Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Objective-aware Traffic Simulation via Inverse Reinforcement Learning [31.26257563160961]
逆強化学習問題として交通シミュレーションを定式化する。
動的ロバストシミュレーション学習のためのパラメータ共有逆強化学習モデルを提案する。
提案モデルでは,実世界の車両の軌道を模倣し,同時に報酬関数を復元することができる。
論文 参考訳(メタデータ) (2021-05-20T07:26:34Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。