論文の概要: Automated and Holistic Co-design of Neural Networks and ASICs for Enabling In-Pixel Intelligence
- arxiv url: http://arxiv.org/abs/2407.14560v1
- Date: Thu, 18 Jul 2024 17:58:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 21:53:36.850777
- Title: Automated and Holistic Co-design of Neural Networks and ASICs for Enabling In-Pixel Intelligence
- Title(参考訳): 画像内インテリジェンスを実現するニューラルネットワークとASICの自動設計
- Authors: Shubha R. Kharel, Prashansa Mukim, Piotr Maj, Grzegorz W. Deptuch, Shinjae Yoo, Yihui Ren, Soumyajit Mandal,
- Abstract要約: 放射能検出のための可読ASICなどの極端エッジAIシステムは、厳密なハードウェア制約の下で動作しなければならない。
理想的なソリューションを見つけることは、爆発的に拡張されたデザイン空間から最適なAIとASIC設計の選択を特定することを意味する。
- 参考スコア(独自算出の注目度): 4.063480188363124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme edge-AI systems, such as those in readout ASICs for radiation detection, must operate under stringent hardware constraints such as micron-level dimensions, sub-milliwatt power, and nanosecond-scale speed while providing clear accuracy advantages over traditional architectures. Finding ideal solutions means identifying optimal AI and ASIC design choices from a design space that has explosively expanded during the merger of these domains, creating non-trivial couplings which together act upon a small set of solutions as constraints tighten. It is impractical, if not impossible, to manually determine ideal choices among possibilities that easily exceed billions even in small-size problems. Existing methods to bridge this gap have leveraged theoretical understanding of hardware to f architecture search. However, the assumptions made in computing such theoretical metrics are too idealized to provide sufficient guidance during the difficult search for a practical implementation. Meanwhile, theoretical estimates for many other crucial metrics (like delay) do not even exist and are similarly variable, dependent on parameters of the process design kit (PDK). To address these challenges, we present a study that employs intelligent search using multi-objective Bayesian optimization, integrating both neural network search and ASIC synthesis in the loop. This approach provides reliable feedback on the collective impact of all cross-domain design choices. We showcase the effectiveness of our approach by finding several Pareto-optimal design choices for effective and efficient neural networks that perform real-time feature extraction from input pulses within the individual pixels of a readout ASIC.
- Abstract(参考訳): 放射能検出のための可読ASICのような極端エッジAIシステムは、従来のアーキテクチャよりも明確な精度の利点を提供しながら、ミクロンレベルの次元、サブミリワットのパワー、ナノ秒スケールのスピードといった厳密なハードウェア制約の下で動作しなければならない。
理想的なソリューションを見つけることは、これらのドメインの合併の間に爆発的に拡張された設計空間から最適なAIとASIC設計の選択を識別することであり、制約を締め付けることで小さなソリューションセットに作用する非自明な結合を生み出す。
不可能ではないとしても、小さな問題であっても数十億を超える可能性の理想的な選択を手動で決定するのは現実的ではない。
このギャップを埋める既存の手法は、ハードウェアの理論的理解をfアーキテクチャ探索に活用している。
しかし、そのような理論的なメトリクスを計算する際の仮定は、現実的な実装の困難な探索において十分なガイダンスを提供するには理想的すぎる。
一方、他の多くの重要な指標(遅延など)の理論的推定は存在せず、同様に可変であり、プロセス設計キット(PDK)のパラメータに依存する。
これらの課題に対処するために,多目的ベイズ最適化を用いたインテリジェント検索を用いて,ニューラルネットワーク探索とASIC合成の両方をループに統合する研究を提案する。
このアプローチは、すべてのクロスドメイン設計選択の集合的影響に対する信頼性の高いフィードバックを提供する。
本稿では,本手法の有効性を示すために,読み出しASICの個々の画素内の入力パルスからリアルタイムの特徴抽出を行う,効率的かつ効率的なニューラルネットワークのためのパレート最適設計選択法を提案する。
関連論文リスト
- ADEPT-Z: Zero-Shot Automated Circuit Topology Search for Pareto-Optimal Photonic Tensor Cores [10.23290448364426]
フォトニックテンソルコア(PTC)は、光学人工知能(AI)アクセラレーターにとって不可欠なビルディングブロックである。
より柔軟で効率的な多目的進化的トポロジ探索フレームワークADEPT-Zを提案する。
論文 参考訳(メタデータ) (2024-10-02T08:09:41Z) - When In-memory Computing Meets Spiking Neural Networks -- A Perspective on Device-Circuit-System-and-Algorithm Co-design [23.828100865782027]
レビューでは、スパイキングニューラルネットワーク(SNN)とアナログインメモリ・コンピューティング(IMC)ドメインという形で、生物解析可能な人工知能の交差点について考察する。
論文 参考訳(メタデータ) (2024-08-22T23:45:40Z) - LitE-SNN: Designing Lightweight and Efficient Spiking Neural Network through Spatial-Temporal Compressive Network Search and Joint Optimization [48.41286573672824]
スパイキングニューラルネットワーク(SNN)は人間の脳の情報処理機構を模倣し、エネルギー効率が高い。
本稿では,空間圧縮と時間圧縮の両方を自動ネットワーク設計プロセスに組み込むLitE-SNNという新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-26T05:23:11Z) - OFA$^2$: A Multi-Objective Perspective for the Once-for-All Neural
Architecture Search [79.36688444492405]
once-for-All(OFA)は、異なるリソース制約を持つデバイスのための効率的なアーキテクチャを探索する問題に対処するために設計された、ニューラルネットワーク検索(NAS)フレームワークである。
我々は,探索段階を多目的最適化問題として明示的に考えることにより,効率の追求を一歩進めることを目指している。
論文 参考訳(メタデータ) (2023-03-23T21:30:29Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - FreeREA: Training-Free Evolution-based Architecture Search [17.202375422110553]
FreeREAは、トレーニングなしメトリクスの最適化組み合わせを利用してアーキテクチャをランク付けする、独自のセルベースの進化NASアルゴリズムである。
本実験はNAS-Bench-101とNATS-Benchの共通ベンチマークを用いて,フリーレアがモデル自動設計のための高速で効率的かつ効果的な探索手法であることを実証した。
論文 参考訳(メタデータ) (2022-06-17T11:16:28Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - A Graph Deep Learning Framework for High-Level Synthesis Design Space
Exploration [11.154086943903696]
High-Level Synthesisは、アプリケーション固有の高速プロトタイピングのためのソリューションである。
本稿では,加速性能とハードウェアコストを共同で予測するグラフニューラルネットワークHLSを提案する。
提案手法は,一般的なシミュレータと同等の精度で予測できることを示す。
論文 参考訳(メタデータ) (2021-11-29T18:17:45Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Robust Topology Optimization Using Multi-Fidelity Variational Autoencoders [1.0124625066746595]
強靭なトポロジー最適化(RTO)問題は、最高の平均性能を持つ設計を特定する。
計算効率を向上するニューラルネットワーク手法を提案する。
本手法の数値解析は,Lブラケット構造のロバスト設計における単一点負荷と複数点負荷について述べる。
論文 参考訳(メタデータ) (2021-07-19T20:40:51Z) - Data-Driven Random Access Optimization in Multi-Cell IoT Networks with
NOMA [78.60275748518589]
非直交多重アクセス(NOMA)は、5Gネットワーク以降で大規模なマシンタイプ通信(mMTC)を可能にする重要な技術です。
本稿では,高密度空間分散マルチセル無線IoTネットワークにおけるランダムアクセス効率向上のために,NOMAを適用した。
ユーザ期待容量の幾何学的平均を最大化するために,各IoTデバイスの伝送確率を調整したランダムチャネルアクセス管理の新たな定式化を提案する。
論文 参考訳(メタデータ) (2021-01-02T15:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。