論文の概要: Control of rough terrain vehicles using deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2107.01867v1
- Date: Mon, 5 Jul 2021 08:43:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 14:50:44.419118
- Title: Control of rough terrain vehicles using deep reinforcement learning
- Title(参考訳): 深部強化学習による荒地車両の制御
- Authors: Viktor Wiberg, Erik Wallin, Martin Servin, Tomas Nordfjell
- Abstract要約: この手紙は16トンの森林車両を知覚し、計画し、うまく制御するコントローラーを提示する。
注意深く形づくられた報酬信号は、安全、環境、および効率的な運転を促進する。
我々は,森林の高密度レーザースキャンから構築した地形を含む仮想環境下での学習技術を検証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the potential to control terrain vehicles using deep reinforcement
in scenarios where human operators and traditional control methods are
inadequate. This letter presents a controller that perceives, plans, and
successfully controls a 16-tonne forestry vehicle with two frame articulation
joints, six wheels, and their actively articulated suspensions to traverse
rough terrain. The carefully shaped reward signal promotes safe, environmental,
and efficient driving, which leads to the emergence of unprecedented driving
skills. We test learned skills in a virtual environment, including terrains
reconstructed from high-density laser scans of forest sites. The controller
displays the ability to handle obstructing obstacles, slopes up to 27$^\circ$,
and a variety of natural terrains, all with limited wheel slip, smooth, and
upright traversal with intelligent use of the active suspensions. The results
confirm that deep reinforcement learning has the potential to enhance control
of vehicles with complex dynamics and high-dimensional observation data
compared to human operators or traditional control methods, especially in rough
terrain.
- Abstract(参考訳): 我々は,人間の操作者や従来の制御方法が不十分なシナリオにおいて,深い強化による地形車両の制御の可能性を探る。
この手紙は、2つのフレーム関節関節、6つの車輪と、荒地を横切るために活発に調律されたサスペンションを備えた16トンの森林車両を知覚し、計画し、うまく制御するコントローラを提示する。
注意深い形をした報酬信号は安全、環境、効率的な運転を促進するため、前例のない運転スキルが出現する。
森林の高密度レーザースキャンから再構成した地形を含む仮想環境での学習スキルをテストする。
コントローラーは障害物を妨害し、最大27$^\circ$まで傾斜し、様々な自然の地形を扱う能力を表示し、全て車輪の滑りが制限され、滑らかで、アクティブサスペンションをインテリジェントに使用して直立する。
その結果、深層強化学習は複雑なダイナミクスと高次元の観測データを持つ車両の制御を、人間の操作者や従来の制御方法、特に荒地と比較して強化する可能性を秘めている。
関連論文リスト
- WROOM: An Autonomous Driving Approach for Off-Road Navigation [17.74237088460657]
オフロード環境における自動運転車のためのエンドツーエンド強化学習システム(RL)を設計する。
ルールベースのコントローラを模倣してエージェントを温め、PPO(Proximal Policy Optimization)を利用してポリシーを改善する。
オフロード走行シナリオを再現する新しいシミュレーション環境を提案し,本提案手法を実車に展開する。
論文 参考訳(メタデータ) (2024-04-12T23:55:59Z) - You Only Crash Once: Improved Object Detection for Real-Time,
Sim-to-Real Hazardous Terrain Detection and Classification for Autonomous
Planetary Landings [7.201292864036088]
危険地を検出するための安価で効果的な方法は、視覚カメラを使用することである。
視覚的危険地形検出の伝統的な技術は、テンプレートマッチングと事前構築されたハザードマップへの登録に焦点を当てている。
深層学習に基づく視覚的危険地形検出と分類技術であるYou Only Crash Once (YOCO)を紹介した。
論文 参考訳(メタデータ) (2023-03-08T21:11:51Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Differentiable Control Barrier Functions for Vision-based End-to-End
Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。
我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文 参考訳(メタデータ) (2022-03-04T16:14:33Z) - Learning Coordinated Terrain-Adaptive Locomotion by Imitating a
Centroidal Dynamics Planner [27.476911967228926]
強化学習(Reinforcement Learning, RL)は、動的リアクティブコントローラを学習できるが、優れた歩行を生み出すためには、慎重に調整された形状の報酬が必要である。
模倣学習は、この問題を回避し、平坦な地形の四足歩行を抽出するためにモーションキャプチャーデータと共に使用されてきた。
学習した方針が見えない地形に移行し、動的に困難な地形を横切るように微調整できることを示す。
論文 参考訳(メタデータ) (2021-10-30T14:24:39Z) - Learning Perceptual Locomotion on Uneven Terrains using Sparse Visual
Observations [75.60524561611008]
この研究は、人中心の環境において、よく見られるバンプ、ランプ、階段の広い範囲にわたる知覚的移動を達成するために、スパースな視覚的観察の使用を活用することを目的としている。
まず、関心の均一な面を表すことのできる最小限の視覚入力を定式化し、このような外受容的・固有受容的データを統合した学習フレームワークを提案する。
本研究では, 平地を全方向歩行し, 障害物のある地形を前方移動させるタスクにおいて, 学習方針を検証し, 高い成功率を示す。
論文 参考訳(メタデータ) (2021-09-28T20:25:10Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - High-speed Autonomous Drifting with Deep Reinforcement Learning [15.766089739894207]
明示的な運動方程式を伴わない頑健なドリフト制御器を提案する。
私たちのコントローラーは、車両をさまざまな鋭い角を素早く、安定して、目に見えない地図に流すことができる。
論文 参考訳(メタデータ) (2020-01-06T03:05:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。