論文の概要: Enhanced Deep Q-Learning for 2D Self-Driving Cars: Implementation and
Evaluation on a Custom Track Environment
- arxiv url: http://arxiv.org/abs/2402.08780v1
- Date: Tue, 13 Feb 2024 20:29:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 17:43:35.243020
- Title: Enhanced Deep Q-Learning for 2D Self-Driving Cars: Implementation and
Evaluation on a Custom Track Environment
- Title(参考訳): 2次元自動運転車の深部Q-Learning:カスタムトラック環境の実装と評価
- Authors: Sagar Pathak, Bidhya Shrestha and Kritish Pahi
- Abstract要約: 本稿では,2次元(2D)カスタムトラック上での自動運転車のためのディープQラーニングネットワーク(DQN)の実装について述べる。
メンフィス大学地図を囲むトラック上で、Pygameを使ったカスタム運転環境の開発を含む。
このアルゴリズムは、車に搭載された7つのセンサーのデータを利用して、車とトラックの距離を計測する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research project presents the implementation of a Deep Q-Learning
Network (DQN) for a self-driving car on a 2-dimensional (2D) custom track, with
the objective of enhancing the DQN network's performance. It encompasses the
development of a custom driving environment using Pygame on a track surrounding
the University of Memphis map, as well as the design and implementation of the
DQN model. The algorithm utilizes data from 7 sensors installed in the car,
which measure the distance between the car and the track. These sensors are
positioned in front of the vehicle, spaced 20 degrees apart, enabling them to
sense a wide area ahead. We successfully implemented the DQN and also a
modified version of the DQN with a priority-based action selection mechanism,
which we refer to as modified DQN. The model was trained over 1000 episodes,
and the average reward received by the agent was found to be around 40, which
is approximately 60% higher than the original DQN and around 50% higher than
the vanilla neural network.
- Abstract(参考訳): 本研究は,DQNネットワークの性能向上を目的とした,2次元(2次元)カスタムトラック上での自動運転車のためのディープQラーニングネットワーク(DQN)の実装を提案する。
これは、メンフィス大学の地図を囲むトラックでpygameを使ったカスタム運転環境の開発と、dqnモデルの設計と実装を含んでいる。
このアルゴリズムは、車載の7つのセンサーからのデータを利用して、車とトラックの距離を測定する。
これらのセンサーは車両の前方に位置し、20度間隔が離れており、前方の広い範囲を感知することができる。
我々は、DQNとDQNの修正版を優先的なアクション選択機構で実装し、これを修正DQNと呼ぶ。
このモデルは1000回以上訓練され、エージェントが受け取る報酬の平均は40回程度であり、これは元のdqnより約60%高く、バニラニューラルネットワークより約50%高い。
関連論文リスト
- Autonomous Navigation of Unmanned Vehicle Through Deep Reinforcement Learning [1.3725832537448668]
本稿では,アッカーマンロボットのモデルとDDPGアルゴリズムの構造と応用について詳述する。
その結果、DDPGアルゴリズムは経路計画タスクにおいて従来のディープQネットワーク(DQN)およびダブルディープQネットワーク(DDQN)アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-07-18T05:18:59Z) - DriveLM: Driving with Graph Visual Question Answering [57.51930417790141]
本研究では,Webスケールデータに基づいて学習した視覚言語モデル(VLM)を,エンド・ツー・エンドの運転システムに統合する方法について検討する。
グラフVQAとエンドツーエンド駆動を併用するVLMベースラインアプローチ(DriveLM-Agent)を提案する。
論文 参考訳(メタデータ) (2023-12-21T18:59:12Z) - Fully End-to-end Autonomous Driving with Semantic Depth Cloud Mapping
and Multi-Agent [2.512827436728378]
本稿では,エンド・ツー・エンドとマルチタスクの学習方法を用いて学習した新しいディープラーニングモデルを提案する。
このモデルは,CARLAシミュレータ上で,現実の環境を模倣するために,通常の状況と異なる天候のシナリオを用いて評価する。
論文 参考訳(メタデータ) (2022-04-12T03:57:01Z) - LiDAR-based 4D Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,両タスクの現在の最先端手法よりも優れた精度を実現する。
DS-Netを4次元パノプティカルLiDARセグメンテーションに拡張し、一列のLiDARフレーム上で時間的に統一されたインスタンスクラスタリングを行う。
論文 参考訳(メタデータ) (2022-03-14T15:25:42Z) - Automatic Extraction of Road Networks from Satellite Images by using
Adaptive Structural Deep Belief Network [0.0]
本研究では,ロードトラッカーと呼ばれる道路網の自動認識手法に適用する。
RoadTracerは航空写真データから地上の道路地図を生成することができる。
精度と計算時間を改善するため,我々のAdaptive DBNはCNNの代わりにRoadTracer上に実装された。
論文 参考訳(メタデータ) (2021-10-25T07:06:10Z) - Workshop on Autonomous Driving at CVPR 2021: Technical Report for
Streaming Perception Challenge [57.647371468876116]
本稿では,現実的な自律運転シナリオのためのリアルタイム2次元物体検出システムについて紹介する。
私たちの検出器は、YOLOXと呼ばれる新しい設計のYOLOモデルで構築されています。
Argoverse-HDデータセットでは,検出のみのトラック/トラックで2位を7.8/6.1上回る41.0ストリーミングAPを達成した。
論文 参考訳(メタデータ) (2021-07-27T06:36:06Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - A Driving Behavior Recognition Model with Bi-LSTM and Multi-Scale CNN [59.57221522897815]
運転行動認識のための軌道情報に基づくニューラルネットワークモデルを提案する。
提案手法を公開BLVDデータセット上で評価し,満足な性能を実現する。
論文 参考訳(メタデータ) (2021-03-01T06:47:29Z) - IntentNet: Learning to Predict Intention from Raw Sensor Data [86.74403297781039]
本論文では,LiDARセンサが生成する3次元点群と,環境の動的なマップの両方を利用するワンステージ検出器と予測器を開発した。
当社のマルチタスクモデルは、それぞれの別々のモジュールよりも高い精度を実現し、計算を節約します。
論文 参考訳(メタデータ) (2021-01-20T00:31:52Z) - A Follow-the-Leader Strategy using Hierarchical Deep Neural Networks
with Grouped Convolutions [0.0]
リーダのタスクは階層型ディープニューラルネットワーク(DNN)のエンドツーエンド駆動モデルを用いて実装される。
モデルはインテリジェンス・プロセッシング・ユニット(IPU)で訓練され、その微粒な計算能力を活用する。
歩行者を追跡する車両の記録が作成され、ウェブで公開されている。
論文 参考訳(メタデータ) (2020-11-04T16:04:42Z) - Identity Recognition in Intelligent Cars with Behavioral Data and
LSTM-ResNet Classifier [5.238954896174913]
モデルへの入力にはガスとブレーキペダル圧を使用します。
我々の分類手法はLSTMとResNetの組み合わせに基づいている。
最終的な精度は、NUDriveの10ドライバサブセットで79.49%、UTDriveの5ドライバサブセットで96.90%に達する。
論文 参考訳(メタデータ) (2020-03-02T11:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。