論文の概要: MOELA: A Multi-Objective Evolutionary/Learning Design Space Exploration
Framework for 3D Heterogeneous Manycore Platforms
- arxiv url: http://arxiv.org/abs/2303.06169v1
- Date: Fri, 10 Mar 2023 19:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 20:42:59.344180
- Title: MOELA: A Multi-Objective Evolutionary/Learning Design Space Exploration
Framework for 3D Heterogeneous Manycore Platforms
- Title(参考訳): moela: 3dヘテロジニアスなマルチコアプラットフォームのための多目的進化/学習デザインスペース探索フレームワーク
- Authors: Sirui Qi, Yingheng Li, Sudeep Pasricha, Ryan Gary Kim
- Abstract要約: 3D Network-on-chip (NoC)により、多くの処理要素(PE)を統合できる異種多コアプラットフォームが必要とされる。
進化型探索と学習型局所探索を組み合わせたMOELAと呼ばれる多目的設計空間探索フレームワークを提案する。
最先端のアプローチと比較して、MOELAは解を見つける速度を最大128倍に向上させる。
- 参考スコア(独自算出の注目度): 3.572107803162502
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To enable emerging applications such as deep machine learning and graph
processing, 3D network-on-chip (NoC) enabled heterogeneous manycore platforms
that can integrate many processing elements (PEs) are needed. However,
designing such complex systems with multiple objectives can be challenging due
to the huge associated design space and long evaluation times. To optimize such
systems, we propose a new multi-objective design space exploration framework
called MOELA that combines the benefits of evolutionary-based search with a
learning-based local search to quickly determine PE and communication link
placement to optimize multiple objectives (e.g., latency, throughput, and
energy) in 3D NoC enabled heterogeneous manycore systems. Compared to
state-of-the-art approaches, MOELA increases the speed of finding solutions by
up to 128x, leads to a better Pareto Hypervolume (PHV) by up to 12.14x and
improves energy-delay-product (EDP) by up to 7.7% in a 5-objective scenario.
- Abstract(参考訳): ディープラーニングやグラフ処理などの新興アプリケーションを実現するためには、3D Network-on-chip(NoC)により、多くの処理要素(PE)を統合するヘテロジニアスなマルチコアプラットフォームが必要になります。
しかし,複数の目的を持った複雑なシステムを設計することは,設計空間が巨大で,評価時間が長いため困難である。
このようなシステムを最適化するため,我々は,進化に基づく探索の利点と学習に基づく局所探索を組み合わせたmoelaと呼ばれる新しい多目的設計空間探索フレームワークを提案し,peと通信リンク配置を迅速に決定し,複数の目的(レイテンシ,スループット,エネルギーなど)を最適化する。
最先端のアプローチと比較して、MOELAは解を見つける速度を最大128倍にし、パレート・ハイパーボリューム(PHV)を最大12.14倍に改善し、エネルギー遅延生成物(EDP)を最大7.7%改善する。
関連論文リスト
- ADEPT-Z: Zero-Shot Automated Circuit Topology Search for Pareto-Optimal Photonic Tensor Cores [10.23290448364426]
フォトニックテンソルコア(PTC)は、光学人工知能(AI)アクセラレーターにとって不可欠なビルディングブロックである。
より柔軟で効率的な多目的進化的トポロジ探索フレームワークADEPT-Zを提案する。
論文 参考訳(メタデータ) (2024-10-02T08:09:41Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Multi-Objective Neural Architecture Search for In-Memory Computing [0.5892638927736115]
我々は、インメモリコンピューティングアーキテクチャに多様な機械学習(ML)タスクをデプロイする効率を高めるために、ニューラルネットワークサーチ(NAS)を採用している。
IMCアーキテクチャ展開のためのNASアプローチの評価は、3つの異なる画像分類データセットにまたがる。
論文 参考訳(メタデータ) (2024-06-10T19:17:09Z) - Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [49.81353382211113]
マルチヘッド自己認識を高分解能表現CNNに効率的に組み込むという課題に対処する。
本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。
本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T15:47:54Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - SimDistill: Simulated Multi-modal Distillation for BEV 3D Object
Detection [56.24700754048067]
多視点カメラによる3Dオブジェクト検出は低コストで普及しているが、カメラデータのみから正確に3D形状を推定することは依然として困難である。
モデルアーキテクチャと蒸留戦略を慎重に構築し,シミュレートされたマルチモーダル蒸留(SimDistill)法を提案する。
我々のSimDistillは、コスト効率のよいカメラのみの配置を維持しながら、3Dオブジェクト検出のためのより良い特徴表現を学習することができる。
論文 参考訳(メタデータ) (2023-03-29T16:08:59Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - HALF: Holistic Auto Machine Learning for FPGAs [1.9146960682777232]
ディープニューラルネットワーク(DNN)は、画像や自然言語処理などの組み込みシステムに関連する領域において、複雑な問題を解決することができる。
特定のFPGAプラットフォームにDNNを効率よく実装するためには、例えばエネルギー効率など、膨大な設計パラメータを考慮する必要がある。
FPGA上でのDNN実装の質は, 自動的, 全体的設計手法により大幅に向上する。
論文 参考訳(メタデータ) (2021-06-28T14:45:47Z) - Learned Hardware/Software Co-Design of Neural Accelerators [20.929918108940093]
ディープラーニングソフトウェアスタックとハードウェアアクセラレータは多様で広大な。
以前の作業では、ハードウェアアーキテクチャとは別途ソフトウェア最適化を検討し、検索スペースを効果的に削減した。
本稿では,ハードウェア/ソフトウェアの共同設計として,共同設計空間における望ましい点を自動的に識別することを目的としている。
論文 参考訳(メタデータ) (2020-10-05T15:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。