論文の概要: Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration
- arxiv url: http://arxiv.org/abs/2211.16385v1
- Date: Tue, 29 Nov 2022 17:10:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 15:36:58.644639
- Title: Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration
- Title(参考訳): マイクロプロセッサ設計空間探索のためのマルチエージェント強化学習
- Authors: Srivatsan Krishnan, Natasha Jaques, Shayegan Omidshafiei, Dan Zhang,
Izzeddin Gur, Vijay Janapa Reddi, Aleksandra Faust
- Abstract要約: マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 71.95914457415624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microprocessor architects are increasingly resorting to domain-specific
customization in the quest for high-performance and energy-efficiency. As the
systems grow in complexity, fine-tuning architectural parameters across
multiple sub-systems (e.g., datapath, memory blocks in different hierarchies,
interconnects, compiler optimization, etc.) quickly results in a combinatorial
explosion of design space. This makes domain-specific customization an
extremely challenging task. Prior work explores using reinforcement learning
(RL) and other optimization methods to automatically explore the large design
space. However, these methods have traditionally relied on single-agent RL/ML
formulations. It is unclear how scalable single-agent formulations are as we
increase the complexity of the design space (e.g., full stack System-on-Chip
design). Therefore, we propose an alternative formulation that leverages
Multi-Agent RL (MARL) to tackle this problem. The key idea behind using MARL is
an observation that parameters across different sub-systems are more or less
independent, thus allowing a decentralized role assigned to each agent. We test
this hypothesis by designing domain-specific DRAM memory controller for several
workload traces. Our evaluation shows that the MARL formulation consistently
outperforms single-agent RL baselines such as Proximal Policy Optimization and
Soft Actor-Critic over different target objectives such as low power and
latency. To this end, this work opens the pathway for new and promising
research in MARL solutions for hardware architecture search.
- Abstract(参考訳): マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
システムが複雑化するにつれて、複数のサブシステム(例えば、データパス、異なる階層のメモリブロック、相互接続、コンパイラ最適化など)にまたがる微調整のアーキテクチャパラメータが急速に設計空間を爆発させる。
これにより、ドメイン固有のカスタマイズが極めて難しいタスクになります。
従来の研究では、大規模な設計空間を自動探索するために強化学習(RL)やその他の最適化手法が用いられていた。
しかし、これらの手法は伝統的に単一エージェントRL/MLの定式化に依存してきた。
設計空間の複雑さ(フルスタックのSystem-on-Chip設計など)が増大するにつれて、シングルエージェントの定式化がどの程度スケーラブルであるかは不明である。
そこで本研究では,マルチエージェントrl (marl) を利用した代替定式化を提案する。
marlを使用する背景にある重要なアイデアは、異なるサブシステム間のパラメータが多かれ少なかれ独立したものであるという観察である。
この仮説は、ドメイン固有のDRAMメモリコントローラを複数のワークロードトレース用に設計することで検証する。
評価の結果、MARLの定式化は、低消費電力や遅延といった異なる目標に対して、プロキシポリシー最適化やソフトアクタクリティカルといった単一エージェントRLのベースラインを一貫して上回ります。
この目的のために,本研究は,ハードウェアアーキテクチャ探索のためのMARLソリューションの新しい,そして有望な研究の道を開く。
関連論文リスト
- AgentSquare: Automatic LLM Agent Search in Modular Design Space [16.659969168343082]
大規模言語モデル(LLM)は、幅広い複雑なタスクを処理できるエージェントシステムの急速な成長をもたらした。
Modularized LLM Agent Search (MoLAS) という新しい研究課題を紹介した。
論文 参考訳(メタデータ) (2024-10-08T15:52:42Z) - Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。
生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。
本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文 参考訳(メタデータ) (2024-08-24T19:34:04Z) - Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [49.81353382211113]
マルチヘッド自己認識を高分解能表現CNNに効率的に組み込むという課題に対処する。
本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。
本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T15:47:54Z) - ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL [80.10358123795946]
大規模言語モデルを微調整するためのマルチターンRLアルゴリズムを構築するためのフレームワークを開発する。
我々のフレームワークは階層的なRLアプローチを採用し、2つのRLアルゴリズムを並列に実行している。
実験により,ArCHerはエージェントタスクの効率と性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-02-29T18:45:56Z) - ArchGym: An Open-Source Gymnasium for Machine Learning Assisted
Architecture Design [52.57999109204569]
ArchGymは、さまざまな検索アルゴリズムをアーキテクチャシミュレータに接続するオープンソースのフレームワークである。
我々は、カスタムメモリコントローラ、ディープニューラルネットワークアクセラレータ、AR/VRワークロード用のカスタムSOCを設計する際に、複数のバニラおよびドメイン固有の検索アルゴリズムにわたってArchGymを評価する。
論文 参考訳(メタデータ) (2023-06-15T06:41:23Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - A Unified and Efficient Coordinating Framework for Autonomous DBMS
Tuning [34.85351481228439]
既存のMLベースのエージェントを効率的に活用するための統合コーディネートフレームワークを提案する。
機械学習ベースのエージェントを効果的に利用し、ワークロードの実行時間に1.414.1Xのスピードアップでより良い設定を実現できることを示す。
論文 参考訳(メタデータ) (2023-03-10T05:27:23Z) - Learning From Good Trajectories in Offline Multi-Agent Reinforcement
Learning [98.07495732562654]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから効果的なマルチエージェントポリシーを学ぶことを目的としている。
オフラインのMARLが学んだエージェントは、しばしばこのランダムなポリシーを継承し、チーム全体のパフォーマンスを脅かす。
この問題に対処するために,共有個人軌道(SIT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-28T18:11:26Z) - Learning Efficient Multi-Agent Cooperative Visual Exploration [18.42493808094464]
複数のエージェントによる視覚的屋内探索の課題を考察し、エージェントはできるだけ少ないステップで屋内全領域を探索する必要がある。
我々は、最先端の単一エージェントRLソリューションであるActive Neural SLAM(ANS)を、新しいRLベースのグローバルゴールプランナーであるSpatial Coordination Planner(SCP)を導入してマルチエージェント設定に拡張する。
SCPは、各エージェントの空間情報をエンドツーエンドに活用し、探索効率の高い異なる空間目標に向けて効果的にエージェントを誘導する。
論文 参考訳(メタデータ) (2021-10-12T04:48:10Z) - Integrating Distributed Architectures in Highly Modular RL Libraries [4.297070083645049]
ほとんどの人気のある強化学習ライブラリは、高度にモジュール化されたエージェントの構成性を主張している。
本稿では、RLエージェントを独立した再利用可能なコンポーネントによって異なるスケールで定義できる汎用的アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-06T10:22:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。