論文の概要: HAWX: A Hardware-Aware FrameWork for Fast and Scalable ApproXimation of DNNs
- arxiv url: http://arxiv.org/abs/2602.16336v1
- Date: Wed, 18 Feb 2026 10:16:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.572983
- Title: HAWX: A Hardware-Aware FrameWork for Fast and Scalable ApproXimation of DNNs
- Title(参考訳): HAWX:DNNの高速かつスケーラブルな近似のためのハードウェア対応フレームワーク
- Authors: Samira Nazari, Mohammad Saeed Almasi, Mahdi Taheri, Ali Azarpeyvand, Ali Mokhtari, Ali Mahani, Christian Herglotz,
- Abstract要約: HAWXはハードウェア対応のスケーラブルな探索フレームワークで、AxCブロックの選択的統合を導くために多レベル感度スコアリングを利用する。
HAWXは、精度、パワー、面積の予測モデルによって支援され、候補構成の評価を加速する。
VGG-11、ResNet-18、EfficientNetLiteといった最先端のDNNベンチマークによる実験では、HAWXの効率性はネットワークサイズと指数関数的にスケールすることを示した。
- 参考スコア(独自算出の注目度): 2.0919087464519275
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents HAWX, a hardware-aware scalable exploration framework that employs multi-level sensitivity scoring at different DNN abstraction levels (operator, filter, layer, and model) to guide selective integration of heterogeneous AxC blocks. Supported by predictive models for accuracy, power, and area, HAWX accelerates the evaluation of candidate configurations, achieving over 23* speedup in a layer-level search with two candidate approximate blocks and more than (3*106)* speedup at the filter-level search only for LeNet-5, while maintaining accuracy comparable to exhaustive search. Experiments across state-of-the-art DNN benchmarks such as VGG-11, ResNet-18, and EfficientNetLite demonstrate that the efficiency benefits of HAWX scale exponentially with network size. The HAWX hardware-aware search algorithm supports both spatial and temporal accelerator architectures, leveraging either off-the-shelf approximate components or customized designs.
- Abstract(参考訳): HAWXはハードウェア対応のスケーラブルな探索フレームワークで、異なるDNN抽象化レベル(演算子、フィルタ、層、モデル)で多レベル感度スコアリングを用いて、異種AxCブロックの選択的統合を導く。
HAWXは、精度、パワー、面積の予測モデルにより、候補構成の評価を加速し、2つの候補近似ブロックを持つ層レベルのサーチにおいて23*以上のスピードアップを達成するとともに、LeNet-5に対してのみフィルタレベルのサーチにおいて3*106以上のスピードアップを達成する。
VGG-11、ResNet-18、EfficientNetLiteといった最先端のDNNベンチマークによる実験では、HAWXの効率性はネットワークサイズと指数関数的にスケールすることを示した。
HAWXハードウェア対応検索アルゴリズムは、空間的および時間的アクセラレーションアーキテクチャをサポートし、既製の近似コンポーネントまたはカスタマイズされたデザインを利用する。
関連論文リスト
- Ev-Edge: Efficient Execution of Event-based Vision Algorithms on Commodity Edge Platforms [10.104371980353973]
Ev-Edgeは、エッジプラットフォーム上でのイベントベースのビジョンシステムのパフォーマンスを高めるために、3つの重要な最適化を含むフレームワークである。
様々な自律ナビゲーションタスクのための最先端ネットワークでは、Ev-Edgeはレイテンシが1.28x-2.05x改善され、エネルギーが1.23x-2.15xになった。
論文 参考訳(メタデータ) (2024-03-23T04:44:55Z) - Flexible Channel Dimensions for Differentiable Architecture Search [50.33956216274694]
本稿では,効率的な動的チャネル割当アルゴリズムを用いた新しい微分可能なニューラルアーキテクチャ探索法を提案する。
提案するフレームワークは,タスク精度と推論遅延において,従来の手法と等価なDNNアーキテクチャを見つけることができることを示す。
論文 参考訳(メタデータ) (2023-06-13T15:21:38Z) - Auto-X3D: Ultra-Efficient Video Understanding via Finer-Grained Neural
Architecture Search [73.05693037548932]
X3Dワークは、複数の軸に沿って手作りの画像アーキテクチャを拡張することで、効率的なビデオモデルの新たなファミリーを提示する。
このような大きな空間を効率的に探索するために確率論的ニューラルネットワーク探索法を採用する。
KineticsとSomething-V2ベンチマークの評価では、私たちのAutoX3DモデルはFLOPで1.3%の精度で既存のモデルより優れています。
論文 参考訳(メタデータ) (2021-12-09T05:40:33Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - HAO: Hardware-aware neural Architecture Optimization for Efficient
Inference [25.265181492143107]
ニューラルネットワーク探索アルゴリズムの設計空間を縮小するための整数プログラミングアルゴリズムを開発する。
私たちのアルゴリズムは、フレームレート50でImageNetの72.5%のトップ-1精度を達成し、MnasNetよりも60%高速で、比較精度でFBNetよりも135%高速です。
論文 参考訳(メタデータ) (2021-04-26T17:59:29Z) - Searching for Fast Model Families on Datacenter Accelerators [33.28421782921072]
高速かつ高精度なCNNモデルファミリをDC加速器上での効率的な推論のために探索する。
本稿では,待ち時間と待ち時間の両方を最適化するLACS法を提案する。
我々のLACSは、ネットワークの深さが画像サイズやネットワーク幅よりもはるかに速く成長することを発見した。
論文 参考訳(メタデータ) (2021-02-10T18:15:40Z) - UXNet: Searching Multi-level Feature Aggregation for 3D Medical Image
Segmentation [34.8581851257193]
本稿では、3次元医用画像分割のための新しいNAS手法であるUXNetを提案する。
UXNetは、エンコーダ-デコーダネットワークのスケールワイズ機能集約戦略とブロックワイズ演算子の両方を検索する。
UXNetが発見したアーキテクチャは、いくつかの公開3D医療画像セグメンテーションベンチマークにおいて、Diceの点で既存の最先端モデルを上回っている。
論文 参考訳(メタデータ) (2020-09-16T06:50:57Z) - Binary DAD-Net: Binarized Driveable Area Detection Network for
Autonomous Driving [94.40107679615618]
本稿では,二項化駆動型領域検出ネットワーク(バイナリDAD-Net)を提案する。
エンコーダ、ボトルネック、デコーダ部分の2重みとアクティベーションのみを使用する。
パブリックデータセット上で、最先端のセマンティックセグメンテーションネットワークより優れています。
論文 参考訳(メタデータ) (2020-06-15T07:09:01Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z) - PatDNN: Achieving Real-Time DNN Execution on Mobile Devices with
Pattern-based Weight Pruning [57.20262984116752]
粗粒構造の内部に新しい次元、きめ細かなプルーニングパターンを導入し、これまで知られていなかった設計空間の点を明らかにした。
きめ細かいプルーニングパターンによって高い精度が実現されているため、コンパイラを使ってハードウェア効率を向上し、保証することがユニークな洞察である。
論文 参考訳(メタデータ) (2020-01-01T04:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。