論文の概要: A Memory Efficient Deep Reinforcement Learning Approach For Snake Game
Autonomous Agents
- arxiv url: http://arxiv.org/abs/2301.11977v1
- Date: Fri, 27 Jan 2023 20:26:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 19:48:57.770311
- Title: A Memory Efficient Deep Reinforcement Learning Approach For Snake Game
Autonomous Agents
- Title(参考訳): スネークゲーム自律エージェントのためのメモリ効率の良い深層強化学習手法
- Authors: Md. Rafat Rahman Tushar and Shahnewaz Siddique
- Abstract要約: 本稿では,環境情報の追加を必要とせず,圧縮画像データに合理的に適合する改良DRL法を提案する。
我々は,Q-networkの変種である軽量畳み込みニューラルネットワーク(CNN)を設計した。
- 参考スコア(独自算出の注目度): 0.799536002595393
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To perform well, Deep Reinforcement Learning (DRL) methods require
significant memory resources and computational time. Also, sometimes these
systems need additional environment information to achieve a good reward.
However, it is more important for many applications and devices to reduce
memory usage and computational times than to achieve the maximum reward. This
paper presents a modified DRL method that performs reasonably well with
compressed imagery data without requiring additional environment information
and also uses less memory and time. We have designed a lightweight
Convolutional Neural Network (CNN) with a variant of the Q-network that
efficiently takes preprocessed image data as input and uses less memory.
Furthermore, we use a simple reward mechanism and small experience replay
memory so as to provide only the minimum necessary information. Our modified
DRL method enables our autonomous agent to play Snake, a classical control
game. The results show our model can achieve similar performance as other DRL
methods.
- Abstract(参考訳): Deep Reinforcement Learning (DRL) 法はメモリ資源と計算時間を必要とする。
また、これらのシステムは良い報奨を得るために追加の環境情報を必要とすることもある。
しかし、多くのアプリケーションやデバイスが最大報酬を達成するよりも、メモリ使用量や計算時間を減らすことが重要である。
本稿では、追加の環境情報を必要とすることなく、圧縮された画像データに合理的に適合する修正DRL法を提案する。
我々は,前処理された画像データを入力として効率的に取り出し,メモリ使用量を減らすqネットワークの変種を備えた軽量畳み込みニューラルネットワーク(cnn)を設計した。
さらに,最小限の必要な情報のみを提供するため,簡単な報奨機構と少ない経験リプレイメモリを用いる。
修正DRL法により,従来の制御ゲームであるSnakeを自律的にプレイできる。
その結果,本モデルでは他のDRL法と同様の性能が得られた。
関連論文リスト
- Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint [104.53687944498155]
強化学習(RL)は、大規模言語モデル(LLM)の訓練に広く用いられている。
本稿では,報酬モデルとして生成モデルを組み込んだRL法 RLMEC を提案する。
生成報酬モデルに基づいて、トレーニングのためのトークンレベルRL目標と、RLプロセスの安定化のための模倣ベース正規化を設計する。
論文 参考訳(メタデータ) (2024-01-11T17:58:41Z) - Reinforcement Learning with Fast and Forgetful Memory [10.087126455388276]
強化学習(RL)に特化して設計されたアルゴリズムに依存しないメモリモデルであるFast and Forgetful Memoryを導入する。
提案手法は,計算心理学に触発された強い構造的先行性を通じて,モデル探索空間を制約する。
Fast and Forgetful Memoryは、リカレントニューラルネットワーク(RNN)よりも2桁高速なトレーニング速度を示す
論文 参考訳(メタデータ) (2023-10-06T09:56:26Z) - Enhancing data efficiency in reinforcement learning: a novel imagination
mechanism based on mesh information propagation [0.3729614006275886]
Imagination Mechanism (IM) と呼ばれる新しいメッシュ情報伝達機構を導入する。
IMは、単一のサンプルによって生成された情報を、エピソード間で異なる状態に効果的にブロードキャストすることを可能にする。
汎用性を促進するため,他の広く採用されているRLアルゴリズムにシームレスかつ流動的に統合可能なプラグイン・アンド・プレイモジュールとして機能するIMを拡張した。
論文 参考訳(メタデータ) (2023-09-25T16:03:08Z) - REBOOT: Reuse Data for Bootstrapping Efficient Real-World Dexterous
Manipulation [61.7171775202833]
本稿では,強化学習による巧妙な操作スキルの学習を効率化するシステムを提案する。
我々のアプローチの主な考え方は、サンプル効率のRLとリプレイバッファブートストラップの最近の進歩の統合である。
本システムでは,実世界の学習サイクルを,模倣に基づくピックアップポリシを通じて学習されたリセットを組み込むことで完遂する。
論文 参考訳(メタデータ) (2023-09-06T19:05:31Z) - On-Device Training Under 256KB Memory [62.95579393237751]
本稿では,256KBのメモリでデバイス上でのトレーニングを可能にするアルゴリズム・システム協調設計フレームワークを提案する。
私たちのフレームワークは256KBと1MBのFlashで畳み込みニューラルネットワークのデバイス上での小さなトレーニングを可能にする最初のソリューションです。
論文 参考訳(メタデータ) (2022-06-30T17:59:08Z) - Mesa: A Memory-saving Training Framework for Transformers [58.78933015299703]
本稿では,トランスフォーマーのためのメモリ節約トレーニングフレームワークであるMesaを紹介する。
Mesaは、フォワードパス中に正確なアクティベーションを使用し、低精度のアクティベーションを格納することで、トレーニング中のメモリ消費を減らす。
ImageNet、CIFAR-100、ADE20Kの実験は、Mesaがトレーニング中にメモリフットプリントの半分を削減できることを示した。
論文 参考訳(メタデータ) (2021-11-22T11:23:01Z) - Improving Computational Efficiency in Visual Reinforcement Learning via
Stored Embeddings [89.63764845984076]
効率的な強化学習のためのストアド埋め込み(SEER)について紹介します。
SEERは、既存の非政治深層強化学習方法の簡単な修正です。
計算とメモリを大幅に節約しながら、SEERがRLizableエージェントのパフォーマンスを低下させないことを示します。
論文 参考訳(メタデータ) (2021-03-04T08:14:10Z) - Optimizing Memory Placement using Evolutionary Graph Reinforcement
Learning [56.83172249278467]
大規模検索空間を対象とした進化グラフ強化学習(EGRL)を提案する。
我々は、推論のために、Intel NNP-Iチップ上で、我々のアプローチを直接訓練し、検証する。
また,NNP-Iコンパイラと比較して28~78%の高速化を実現している。
論文 参考訳(メタデータ) (2020-07-14T18:50:12Z) - Can Increasing Input Dimensionality Improve Deep Reinforcement Learning? [15.578423102700764]
本稿では,ニューラルネットを用いたオンライン特徴抽出ネットワーク(OFENet)を提案する。
我々はRLエージェントが低次元状態観測よりも高次元表現でより効率的に学習できることを示す。
論文 参考訳(メタデータ) (2020-03-03T16:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。