論文の概要: A3C-S: Automated Agent Accelerator Co-Search towards Efficient Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2106.06577v1
- Date: Fri, 11 Jun 2021 18:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 15:53:18.068700
- Title: A3C-S: Automated Agent Accelerator Co-Search towards Efficient Deep
Reinforcement Learning
- Title(参考訳): A3C-S:効率的な深層強化学習に向けたエージェントアクセラレータの共同探索
- Authors: Yonggan Fu, Yongan Zhang, Chaojian Li, Zhongzhi Yu, Yingyan Lin
- Abstract要約: 本稿では,最適に整合したDRLエージェントとアクセルを自動的に共同検索する,A3C-S(Automated Agent Accelerator Co-Search)フレームワークを提案する。
我々の実験は、最先端技術よりもA3C-Sの方が優れていることを一貫して検証している。
- 参考スコア(独自算出の注目度): 16.96187187108041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driven by the explosive interest in applying deep reinforcement learning
(DRL) agents to numerous real-time control and decision-making applications,
there has been a growing demand to deploy DRL agents to empower daily-life
intelligent devices, while the prohibitive complexity of DRL stands at odds
with limited on-device resources. In this work, we propose an Automated Agent
Accelerator Co-Search (A3C-S) framework, which to our best knowledge is the
first to automatically co-search the optimally matched DRL agents and
accelerators that maximize both test scores and hardware efficiency. Extensive
experiments consistently validate the superiority of our A3C-S over
state-of-the-art techniques.
- Abstract(参考訳): 深層強化学習(drl)エージェントを多数のリアルタイム制御や意思決定アプリケーションに適用することに対する爆発的な関心から、drlエージェントを日々のインテリジェントなデバイスを強化するために展開する需要が高まっている一方で、drlの複雑さは限られたオンデバイスリソースと相反する。
本研究では,テストスコアとハードウェア効率の両方を最大化する最適なdrlエージェントとアクセラレーションを自動的に探索する最善の知識に対して,a3c-s(automated agent accelerator co-search)フレームワークを提案する。
広範な実験は、最先端の技術よりもa3c-sの方が優れていることを一貫して検証します。
関連論文リスト
- RL-GPT: Integrating Reinforcement Learning and Code-as-policy [82.1804241891039]
本稿では,低速エージェントと高速エージェントからなる2レベル階層型フレームワークRL-GPTを提案する。
遅いエージェントはコーディングに適したアクションを分析し、速いエージェントはコーディングタスクを実行する。
この分解は、各エージェントが特定のタスクに効果的に集中し、パイプライン内で非常に効率的なことを証明します。
論文 参考訳(メタデータ) (2024-02-29T16:07:22Z) - Automated Reinforcement Learning (AutoRL): A Survey and Open Problems [92.73407630874841]
AutoRL(Automated Reinforcement Learning)には、AutoMLの標準的なアプリケーションだけでなく、RL特有の課題も含まれている。
我々は共通の分類法を提供し、各領域を詳細に議論し、今後の研究者にとって関心のあるオープンな問題を提起する。
論文 参考訳(メタデータ) (2022-01-11T12:41:43Z) - DDPG car-following model with real-world human driving experience in
CARLA [0.0]
そこで本研究では,現実世界の人間の運転から学習し,純粋なDRLエージェントよりも優れた性能を実現する2段階のDeep Reinforcement Learning(DRL)手法を提案する。
評価のために、提案した2段DRLエージェントと純粋なDRLエージェントを比較するために、異なる実世界の運転シナリオを設計した。
論文 参考訳(メタデータ) (2021-12-29T15:22:31Z) - WAD: A Deep Reinforcement Learning Agent for Urban Autonomous Driving [8.401473551081747]
本稿では,DRL駆動型ウォッチ・アンド・ドライブ(WAD)エージェントをエンド・ツー・エンドの都市自動運転に適用する。
この研究は、最近の進歩により、CARLAの高次元空間における重要な物体や状態を検出し、それらから潜伏状態を取り出すことを目的としている。
我々の新しいアプローチは、少ないリソース、異なる運転タスクのステップバイステップ学習、ハードエピソード終了ポリシー、報酬メカニズムを利用して、エージェントは全ての運転タスクで100%の成功率を達成することができた。
論文 参考訳(メタデータ) (2021-08-27T06:48:31Z) - Explore and Control with Adversarial Surprise [78.41972292110967]
強化学習(Reinforcement Learning, RL)は、目標指向のポリシーを学習するためのフレームワークである。
本稿では,RLエージェントが経験した驚きの量と競合する2つのポリシーを相殺する対戦ゲームに基づく,新しい教師なしRL手法を提案する。
本手法は, 明確な相転移を示すことによって, 複雑なスキルの出現につながることを示す。
論文 参考訳(メタデータ) (2021-07-12T17:58:40Z) - Hierarchical Program-Triggered Reinforcement Learning Agents For
Automated Driving [5.404179497338455]
Reinforcement Learning(RL)とDeep Learning(DL)の最近の進歩は、自動運転を含む複雑なタスクで印象的なパフォーマンスを示しています。
本稿では,構造化プログラムと複数のrlエージェントからなる階層構造を用いて,比較的単純なタスクを実行するように訓練した階層型プログラムトリガー型強化学習法を提案する。
検証の焦点はRLエージェントからの単純な保証の下でマスタープログラムにシフトし、複雑なRLエージェントよりも解釈可能で検証可能な実装となる。
論文 参考訳(メタデータ) (2021-03-25T14:19:54Z) - Auto-Agent-Distiller: Towards Efficient Deep Reinforcement Learning
Agents via Neural Architecture Search [14.292072505007974]
本稿では,様々なタスクに対して最適なDRLエージェントを自動検索するAuto-Agent-Distiller (A2D) フレームワークを提案する。
我々は,バニラNASがDRLトレーニング安定性のばらつきが大きいため,最適なエージェントの探索に容易に失敗できることを実証した。
そこで我々は,教師エージェントのアクターと評論家の両方から知識を抽出し,探索プロセスを安定化し,探索エージェントの最適性を向上する新しい蒸留機構を開発する。
論文 参考訳(メタデータ) (2020-12-24T04:07:36Z) - Efficient Reinforcement Learning Development with RLzoo [21.31425280231093]
既存のDeep Reinforcement Learning (DRL)ライブラリは、DRLエージェントのプロトタイピングを貧弱にサポートしている。
DRLエージェントの開発を効率化することを目的とした新しいDRLライブラリRLzooを紹介する。
論文 参考訳(メタデータ) (2020-09-18T06:18:49Z) - Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。
敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文 参考訳(メタデータ) (2020-08-05T07:49:42Z) - Distributed Reinforcement Learning for Cooperative Multi-Robot Object
Manipulation [53.262360083572005]
強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクの検討
分散近似RL(DA-RL)とゲーム理論RL(GT-RL)の2つの分散マルチエージェントRLアプローチを提案する。
本稿では, DA-RL と GT-RL を多エージェントシステムに適用し, 大規模システムへの拡張が期待される。
論文 参考訳(メタデータ) (2020-03-21T00:43:54Z) - Scalable Multi-Agent Inverse Reinforcement Learning via
Actor-Attention-Critic [54.2180984002807]
マルチエージェント逆逆強化学習 (MA-AIRL) は, 単エージェントAIRLをマルチエージェント問題に適用する最近の手法である。
本稿では,従来の手法よりもサンプル効率が高く,スケーラブルなマルチエージェント逆RLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-24T20:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。