論文の概要: MOELA: A Multi-Objective Evolutionary/Learning Design Space Exploration
Framework for 3D Heterogeneous Manycore Platforms
- arxiv url: http://arxiv.org/abs/2303.06169v1
- Date: Fri, 10 Mar 2023 19:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 20:42:59.344180
- Title: MOELA: A Multi-Objective Evolutionary/Learning Design Space Exploration
Framework for 3D Heterogeneous Manycore Platforms
- Title(参考訳): moela: 3dヘテロジニアスなマルチコアプラットフォームのための多目的進化/学習デザインスペース探索フレームワーク
- Authors: Sirui Qi, Yingheng Li, Sudeep Pasricha, Ryan Gary Kim
- Abstract要約: 3D Network-on-chip (NoC)により、多くの処理要素(PE)を統合できる異種多コアプラットフォームが必要とされる。
進化型探索と学習型局所探索を組み合わせたMOELAと呼ばれる多目的設計空間探索フレームワークを提案する。
最先端のアプローチと比較して、MOELAは解を見つける速度を最大128倍に向上させる。
- 参考スコア(独自算出の注目度): 3.572107803162502
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To enable emerging applications such as deep machine learning and graph
processing, 3D network-on-chip (NoC) enabled heterogeneous manycore platforms
that can integrate many processing elements (PEs) are needed. However,
designing such complex systems with multiple objectives can be challenging due
to the huge associated design space and long evaluation times. To optimize such
systems, we propose a new multi-objective design space exploration framework
called MOELA that combines the benefits of evolutionary-based search with a
learning-based local search to quickly determine PE and communication link
placement to optimize multiple objectives (e.g., latency, throughput, and
energy) in 3D NoC enabled heterogeneous manycore systems. Compared to
state-of-the-art approaches, MOELA increases the speed of finding solutions by
up to 128x, leads to a better Pareto Hypervolume (PHV) by up to 12.14x and
improves energy-delay-product (EDP) by up to 7.7% in a 5-objective scenario.
- Abstract(参考訳): ディープラーニングやグラフ処理などの新興アプリケーションを実現するためには、3D Network-on-chip(NoC)により、多くの処理要素(PE)を統合するヘテロジニアスなマルチコアプラットフォームが必要になります。
しかし,複数の目的を持った複雑なシステムを設計することは,設計空間が巨大で,評価時間が長いため困難である。
このようなシステムを最適化するため,我々は,進化に基づく探索の利点と学習に基づく局所探索を組み合わせたmoelaと呼ばれる新しい多目的設計空間探索フレームワークを提案し,peと通信リンク配置を迅速に決定し,複数の目的(レイテンシ,スループット,エネルギーなど)を最適化する。
最先端のアプローチと比較して、MOELAは解を見つける速度を最大128倍にし、パレート・ハイパーボリューム(PHV)を最大12.14倍に改善し、エネルギー遅延生成物(EDP)を最大7.7%改善する。
関連論文リスト
- Multi-objective Differentiable Neural Architecture Search [62.16997839075649]
本研究では,パフォーマンスとハードウェアメトリクスのトレードオフのために,ユーザの好みを符号化するNASアルゴリズムを提案する。
提案手法は,定性的に異なる探索空間とデータセットをまたいだ既存のMOO NAS法より優れている。
論文 参考訳(メタデータ) (2024-02-28T10:09:04Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - DLAS: An Exploration and Assessment of the Deep Learning Acceleration
Stack [3.7873597471903935]
私たちはDeep Learning Acceleration Stack (DLAS)で機械学習とシステム技術を組み合わせています。
2つのデータセット間でDLASのパラメータが異なる場合の精度と推定時間への影響を評価した。
全体として、圧縮技術によって提供されるスピードアップは、非常にハードウェアに依存している。
論文 参考訳(メタデータ) (2023-11-15T12:26:31Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - SimDistill: Simulated Multi-modal Distillation for BEV 3D Object
Detection [56.24700754048067]
多視点カメラによる3Dオブジェクト検出は低コストで普及しているが、カメラデータのみから正確に3D形状を推定することは依然として困難である。
モデルアーキテクチャと蒸留戦略を慎重に構築し,シミュレートされたマルチモーダル蒸留(SimDistill)法を提案する。
我々のSimDistillは、コスト効率のよいカメラのみの配置を維持しながら、3Dオブジェクト検出のためのより良い特徴表現を学習することができる。
論文 参考訳(メタデータ) (2023-03-29T16:08:59Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View
Representation [116.6111047218081]
本稿では,汎用マルチタスクマルチセンサ融合フレームワークであるBEVFusionを紹介する。
共有鳥眼ビュー表示空間におけるマルチモーダル特徴を統一する。
3Dオブジェクト検出では1.3%高いmAPとNDS、BEVマップのセグメンテーションでは13.6%高いmIoU、コストは1.9倍である。
論文 参考訳(メタデータ) (2022-05-26T17:59:35Z) - HALF: Holistic Auto Machine Learning for FPGAs [1.9146960682777232]
ディープニューラルネットワーク(DNN)は、画像や自然言語処理などの組み込みシステムに関連する領域において、複雑な問題を解決することができる。
特定のFPGAプラットフォームにDNNを効率よく実装するためには、例えばエネルギー効率など、膨大な設計パラメータを考慮する必要がある。
FPGA上でのDNN実装の質は, 自動的, 全体的設計手法により大幅に向上する。
論文 参考訳(メタデータ) (2021-06-28T14:45:47Z) - Learned Hardware/Software Co-Design of Neural Accelerators [20.929918108940093]
ディープラーニングソフトウェアスタックとハードウェアアクセラレータは多様で広大な。
以前の作業では、ハードウェアアーキテクチャとは別途ソフトウェア最適化を検討し、検索スペースを効果的に削減した。
本稿では,ハードウェア/ソフトウェアの共同設計として,共同設計空間における望ましい点を自動的に識別することを目的としている。
論文 参考訳(メタデータ) (2020-10-05T15:12:52Z) - Dataflow Aware Mapping of Convolutional Neural Networks Onto Many-Core
Platforms With Network-on-Chip Interconnect [0.0764671395172401]
マシンインテリジェンス、特に畳み込みニューラルネットワーク(CNN)は、ここ数年で大きな研究領域となっている。
複数の同質なコアで構成される多コアプラットフォームは、データフローマッピングの労力の増大を犠牲にして、物理実装に関する制限を緩和することができる。
この作業は、最小限のランタイムと最小限のオフチップメモリアクセスに対して、最適化目標の異なるシングルコアレベルから始まる自動マッピング戦略を示す。
この戦略は、適切なマルチコアマッピング方式に拡張され、ネットワークオンチップ相互接続によるスケーラブルなシステムレベルシミュレーションを用いて評価される。
論文 参考訳(メタデータ) (2020-06-18T17:13:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。