論文の概要: Deep Reinforcement Learning with Mixed Convolutional Network
- arxiv url: http://arxiv.org/abs/2010.00717v2
- Date: Tue, 6 Oct 2020 04:35:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 07:51:45.480947
- Title: Deep Reinforcement Learning with Mixed Convolutional Network
- Title(参考訳): 混合畳み込みネットワークによる深層強化学習
- Authors: Yanyu Zhang
- Abstract要約: 本稿では,OpenAI Gymにおける模倣学習を用いて,CarRacing-v0を再生する畳み込みニューラルネットワーク(CNN)を提案する。
データセットは、Gymで手動でゲームをプレイすることで生成され、データ拡張方法を使用してデータセットを以前より4倍大きく拡張する。
トレーニング後、このモデルは道路の特徴の境界を自動的に検出し、ロボットを人間のように駆動する。
- 参考スコア(独自算出の注目度): 8.05881526425515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research has shown that map raw pixels from a single front-facing
camera directly to steering commands are surprisingly powerful. This paper
presents a convolutional neural network (CNN) to playing the CarRacing-v0 using
imitation learning in OpenAI Gym. The dataset is generated by playing the game
manually in Gym and used a data augmentation method to expand the dataset to 4
times larger than before. Also, we read the true speed, four ABS sensors,
steering wheel position, and gyroscope for each image and designed a mixed
model by combining the sensor input and image input. After training, this model
can automatically detect the boundaries of road features and drive the robot
like a human. By comparing with AlexNet and VGG16 using the average reward in
CarRacing-v0, our model wins the maximum overall system performance.
- Abstract(参考訳): 最近の研究では、1つの前面カメラからの生のピクセルを直接操舵コマンドにマップすることは驚くほど強力であることが示されている。
本稿では,OpenAI Gymの模倣学習を用いてCarRacing-v0を再生する畳み込みニューラルネットワーク(CNN)を提案する。
データセットは、ジムで手動でゲームをプレイして生成し、データ拡張法を使用して、データセットを以前より4倍大きく拡張する。
また,実際の速度,4つのABSセンサ,操舵輪位置,ジャイロスコープを画像毎に読み出し,センサ入力と画像入力を組み合わせた混合モデルの設計を行った。
トレーニング後、このモデルは道路の特徴の境界を自動的に検出し、ロボットを人間のように駆動する。
CarRacing-v0における平均報酬を用いたAlexNetとVGG16を比較することで,システム全体の性能が最大になる。
関連論文リスト
- SplatAD: Real-Time Lidar and Camera Rendering with 3D Gaussian Splatting for Autonomous Driving [6.221538885604869]
カメラとライダーデータのセンサリアリスティックレンダリングのための既存のニューラル放射場(NeRF)法は、低レンダリング速度に悩まされている。
SplatADは,カメラとライダーデータの両方の動的シーンをリアルかつリアルタイムにレンダリングするための,最初の3DGSベースの手法である。
論文 参考訳(メタデータ) (2024-11-25T16:18:22Z) - Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。
我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。
感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文 参考訳(メタデータ) (2023-06-16T17:58:10Z) - Neural Scene Representation for Locomotion on Structured Terrain [56.48607865960868]
本研究では,都市環境を横断する移動ロボットの局所的な地形を再構築する学習手法を提案する。
搭載されたカメラとロボットの軌道からの深度測定のストリームを用いて、ロボットの近傍の地形を推定する。
ノイズ測定とカメラ配置の盲点からの大量の欠落データにもかかわらず,シーンを忠実に再構築する3次元再構成モデルを提案する。
論文 参考訳(メタデータ) (2022-06-16T10:45:17Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Robust 2D/3D Vehicle Parsing in CVIS [54.825777404511605]
本研究では,協調型車両インフラシステム(CVIS)の一環として,異なるカメラビューの車両を堅牢に検出・認識する新しいアプローチを提案する。
提案方式は任意のカメラビュー向けに設計されており,本質的パラメータや外部的パラメータを仮定しない。
実際に,本手法は2次元検出,インスタンスセグメンテーション,6-DoFのポーズ推定においてSOTA法より優れている。
論文 参考訳(メタデータ) (2021-03-11T03:35:05Z) - CNN-based Visual Ego-Motion Estimation for Fast MAV Maneuvers [5.721124285238146]
高速移動する単眼カメラからの画像間の相対的なポーズを予測する畳み込みニューラルネットワーク(CNN)について検討する。
本研究のネットワークは, モデルサイズが小さく, 推論速度も高い。
トレーニングやテスト用の画像は、リアルな動きのぼやけがあります。
論文 参考訳(メタデータ) (2021-01-06T01:20:29Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - A Follow-the-Leader Strategy using Hierarchical Deep Neural Networks
with Grouped Convolutions [0.0]
リーダのタスクは階層型ディープニューラルネットワーク(DNN)のエンドツーエンド駆動モデルを用いて実装される。
モデルはインテリジェンス・プロセッシング・ユニット(IPU)で訓練され、その微粒な計算能力を活用する。
歩行者を追跡する車両の記録が作成され、ウェブで公開されている。
論文 参考訳(メタデータ) (2020-11-04T16:04:42Z) - PerMO: Perceiving More at Once from a Single Image for Autonomous
Driving [76.35684439949094]
単一画像から完全テクスチャ化された車両の3次元モデルを検出し,セグメント化し,再構成する新しい手法を提案する。
私たちのアプローチは、ディープラーニングの強みと従来のテクニックの優雅さを組み合わせています。
我々はこれらのアルゴリズムを自律運転システムに統合した。
論文 参考訳(メタデータ) (2020-07-16T05:02:45Z) - Neural Game Engine: Accurate learning of generalizable forward models
from pixels [0.0]
本稿では,ピクセルから直接モデルを学習する手段として,ニューラルゲームエンジンを紹介する。
10の決定論的汎用ビデオゲームAIゲームの結果は、競争力のあるパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-03-23T20:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。