論文の概要: D2RL: Deep Dense Architectures in Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2010.09163v2
- Date: Fri, 27 Nov 2020 20:22:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 22:24:32.238703
- Title: D2RL: Deep Dense Architectures in Reinforcement Learning
- Title(参考訳): D2RL:強化学習における深度アーキテクチャ
- Authors: Samarth Sinha, Homanga Bharadhwaj, Aravind Srinivas, Animesh Garg
- Abstract要約: コンピュータビジョンと生成モデルにおけるアーキテクチャ選択の成功からインスピレーションを得ます。
各種ロボット学習ベンチマーク環境における強化学習における深層ネットワークと高密度接続の利用について検討した。
- 参考スコア(独自算出の注目度): 47.67475810050311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While improvements in deep learning architectures have played a crucial role
in improving the state of supervised and unsupervised learning in computer
vision and natural language processing, neural network architecture choices for
reinforcement learning remain relatively under-explored. We take inspiration
from successful architectural choices in computer vision and generative
modelling, and investigate the use of deeper networks and dense connections for
reinforcement learning on a variety of simulated robotic learning benchmark
environments. Our findings reveal that current methods benefit significantly
from dense connections and deeper networks, across a suite of manipulation and
locomotion tasks, for both proprioceptive and image-based observations. We hope
that our results can serve as a strong baseline and further motivate future
research into neural network architectures for reinforcement learning. The
project website with code is at this link
https://sites.google.com/view/d2rl/home.
- Abstract(参考訳): ディープラーニングアーキテクチャの改善は、コンピュータビジョンや自然言語処理における教師付きおよび教師なし学習の状況を改善する上で重要な役割を担っているが、強化学習のためのニューラルネットワークアーキテクチャの選択は、いまだに未熟である。
コンピュータビジョンと生成モデルにおけるアーキテクチャ選択の成功からインスピレーションを得て,様々なロボット学習ベンチマーク環境において,より深いネットワークと高密度接続を用いて強化学習を行う。
以上の結果から,現状の手法は,密接な接続や深いネットワーク,操作やロコモーションタスクのスイートを通じて,固有認識と画像に基づく観察の両方において有益であることが判明した。
私たちの成果が強力なベースラインとして機能し、強化学習のためのニューラルネットワークアーキテクチャに関するさらなる研究の動機になることを期待しています。
コード付きプロジェクトのwebサイトは、このリンクhttps://sites.google.com/view/d2rl/home.comにある。
関連論文リスト
- DQNAS: Neural Architecture Search using Reinforcement Learning [6.33280703577189]
畳み込みニューラルネットワークは様々な画像関連アプリケーションで使われている。
本稿では,強化学習の原則を取り入れた,ニューラルネットワークの自動探索フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-17T04:01:47Z) - The Neural Race Reduction: Dynamics of Abstraction in Gated Networks [12.130628846129973]
本稿では,情報フローの経路が学習力学に与える影響をスキーマ化するGated Deep Linear Networkフレームワークを紹介する。
正確な還元と、特定の場合において、学習のダイナミクスに対する正確な解が導出されます。
我々の研究は、ニューラルネットワークと学習に関する一般的な仮説を生み出し、より複雑なアーキテクチャの設計を理解するための数学的アプローチを提供する。
論文 参考訳(メタデータ) (2022-07-21T12:01:03Z) - Neural Architecture Search for Dense Prediction Tasks in Computer Vision [74.9839082859151]
ディープラーニングは、ニューラルネットワークアーキテクチャエンジニアリングに対する需要の高まりにつながっている。
ニューラルネットワーク検索(NAS)は、手動ではなく、データ駆動方式でニューラルネットワークアーキテクチャを自動設計することを目的としている。
NASはコンピュータビジョンの幅広い問題に適用されている。
論文 参考訳(メタデータ) (2022-02-15T08:06:50Z) - Improving Sample Efficiency of Value Based Models Using Attention and
Vision Transformers [52.30336730712544]
性能を犠牲にすることなくサンプル効率を向上させることを目的とした深層強化学習アーキテクチャを提案する。
状態表現の特徴マップ上の自己注意機構を変換器を用いて学習する視覚的注意モデルを提案する。
我々は,このアーキテクチャがいくつかのAtari環境におけるサンプルの複雑さを向上すると同時に,いくつかのゲームにおいて優れたパフォーマンスを実現することを実証的に実証した。
論文 参考訳(メタデータ) (2022-02-01T19:03:03Z) - Improving the sample-efficiency of neural architecture search with
reinforcement learning [0.0]
この作業では、Automated Machine Learning(AutoML)の領域にコントリビュートしたいと思っています。
我々の焦点は、最も有望な研究方向の一つ、強化学習である。
児童ネットワークの検証精度は、コントローラを訓練するための報奨信号として機能する。
我々は、これをより現代的で複雑なアルゴリズムであるPPOに修正することを提案する。
論文 参考訳(メタデータ) (2021-10-13T14:30:09Z) - Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey [29.309914600633032]
ディープ強化学習は強化学習フレームワークを強化し、ディープニューラルネットワークの強力な表現を活用する。
近年の研究では、ファイナンス、医療、医療、ビデオゲーム、ロボティクス、コンピュータビジョンなど様々な分野で、深い強化学習が顕著に成功している。
論文 参考訳(メタデータ) (2021-08-25T23:01:48Z) - Efficient Neural Architecture Search with Performance Prediction [0.0]
ニューラルアーキテクチャ検索を使用して、目前にあるタスクに最適なネットワークアーキテクチャを見つけます。
既存のNASアルゴリズムは、スクラッチから完全にトレーニングすることで、新しいアーキテクチャの適合性を評価する。
サンプルアーキテクチャの評価を高速化するために,エンドツーエンドのオフライン性能予測器を提案する。
論文 参考訳(メタデータ) (2021-08-04T05:44:16Z) - A Design Space Study for LISTA and Beyond [79.76740811464597]
近年では、反復アルゴリズムの展開による問題固有のディープネットワーク構築に大きな成功を収めている。
本稿では,深層ネットワークにおける設計アプローチとしてのアンローリングの役割について再考する。
スパースリカバリのためのlistaを代表例として,未ロールモデルに対する設計空間調査を初めて実施した。
論文 参考訳(メタデータ) (2021-04-08T23:01:52Z) - Firefly Neural Architecture Descent: a General Approach for Growing
Neural Networks [50.684661759340145]
firefly neural architecture descentは、ニューラルネットワークを漸進的かつ動的に成長させるための一般的なフレームワークである。
ホタルの降下は、より広く、より深くネットワークを柔軟に成長させ、正確だがリソース効率のよいニューラルアーキテクチャを学習するために応用できることを示す。
特に、サイズは小さいが、最先端の手法で学習したネットワークよりも平均精度が高いネットワークを学習する。
論文 参考訳(メタデータ) (2021-02-17T04:47:18Z) - NAS-DIP: Learning Deep Image Prior with Neural Architecture Search [65.79109790446257]
近年の研究では、深部畳み込みニューラルネットワークの構造が、以前に構造化された画像として利用できることが示されている。
我々は,より強い画像の先行を捉えるニューラルネットワークの探索を提案する。
既存のニューラルネットワーク探索アルゴリズムを利用して,改良されたネットワークを探索する。
論文 参考訳(メタデータ) (2020-08-26T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。