論文の概要: ApproXAI: Energy-Efficient Hardware Acceleration of Explainable AI using Approximate Computing
- arxiv url: http://arxiv.org/abs/2504.17929v1
- Date: Thu, 24 Apr 2025 20:40:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.572401
- Title: ApproXAI: Energy-Efficient Hardware Acceleration of Explainable AI using Approximate Computing
- Title(参考訳): ApproXAI: 近似コンピューティングを用いた説明可能なAIのエネルギー効率の良いハードウェア高速化
- Authors: Ayesha Siddique, Khurram Khalil, Khaza Anuarul Hoque,
- Abstract要約: XAIedgeは、近似計算技術をXAIアルゴリズムに活用する新しいフレームワークである。
XAIedgeはこれらのアルゴリズムを近似行列計算に変換し、畳み込み、フーリエ変換、近似計算パラダイムの相乗効果を利用する。
総合評価の結果,既存のXAIハードウェアアクセラレーション技術と比較して,XAIedgeのエネルギー効率は2倍に向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Explainable artificial intelligence (XAI) enhances AI system transparency by framing interpretability as an optimization problem. However, this approach often necessitates numerous iterations of computationally intensive operations, limiting its applicability in real-time scenarios. While recent research has focused on XAI hardware acceleration on FPGAs and TPU, these methods do not fully address energy efficiency in real-time settings. To address this limitation, we propose XAIedge, a novel framework that leverages approximate computing techniques into XAI algorithms, including integrated gradients, model distillation, and Shapley analysis. XAIedge translates these algorithms into approximate matrix computations and exploits the synergy between convolution, Fourier transform, and approximate computing paradigms. This approach enables efficient hardware acceleration on TPU-based edge devices, facilitating faster real-time outcome interpretations. Our comprehensive evaluation demonstrates that XAIedge achieves a $2\times$ improvement in energy efficiency compared to existing accurate XAI hardware acceleration techniques while maintaining comparable accuracy. These results highlight the potential of XAIedge to significantly advance the deployment of explainable AI in energy-constrained real-time applications.
- Abstract(参考訳): 説明可能な人工知能(XAI)は、最適化問題として解釈可能性のフレーミングによって、AIシステムの透明性を高める。
しかし、このアプローチは計算集約的な操作の繰り返しを必要とすることが多く、リアルタイムシナリオにおける適用性を制限している。
近年,FPGA と TPU における XAI ハードウェアアクセラレーションに着目している。
この制限に対処するため、我々はXAIedgeを提案する。XAIedgeは、積分勾配、モデル蒸留、シェープ解析を含む近似計算技術をXAIアルゴリズムに活用する新しいフレームワークである。
XAIedgeはこれらのアルゴリズムを近似行列計算に変換し、畳み込み、フーリエ変換、近似計算パラダイムの相乗効果を利用する。
このアプローチは、TPUベースのエッジデバイス上で効率的なハードウェアアクセラレーションを可能にし、より高速なリアルタイム結果解釈を実現する。
我々の総合的な評価は、XAIedgeが既存の正確なXAIハードウェアアクセラレーション技術と比較してエネルギー効率を2倍に向上し、同等の精度を維持していることを示している。
これらの結果は、エネルギー制約のあるリアルタイムアプリケーションにおける説明可能なAIの展開を大幅に前進させるXAIedgeの可能性を浮き彫りにしている。
関連論文リスト
- QuartDepth: Post-Training Quantization for Real-Time Depth Estimation on the Edge [55.75103034526652]
ASIC のハードウェアアクセラレーションによる MDE モデルの定量化を後学習量子化に応用した QuartDepth を提案する。
提案手法では,重みとアクティベーションの両方を4ビット精度で定量化し,モデルサイズと計算コストを削減する。
我々は、カーネル融合とカスタマイズされた命令プログラム性をサポートすることにより、フレキシブルでプログラム可能なハードウェアアクセラレータを設計する。
論文 参考訳(メタデータ) (2025-03-20T21:03:10Z) - Efficient Implementation of LinearUCB through Algorithmic Improvements and Vector Computing Acceleration for Embedded Learning Systems [0.10470286407954035]
本稿では,リソース制約の組込みデバイスに2つのLinearUCBコンテキスト帯域アルゴリズムを実装するアルゴリズムとハードウェア技術を提案する。
その結果, 実行時間とエネルギー消費は顕著に改善した。
論文 参考訳(メタデータ) (2025-01-22T13:39:44Z) - Enhancing Dropout-based Bayesian Neural Networks with Multi-Exit on FPGA [20.629635991749808]
本稿では,フィールドプログラマブルゲートアレイ(FPGA)ベースのアクセラレータを効率よく生成するアルゴリズムとハードウェアの共同設計フレームワークを提案する。
アルゴリズムレベルでは、計算とメモリのオーバーヘッドを低減した、新しいマルチエグジット・ドロップアウトベースのベイズNNを提案する。
ハードウェアレベルでは,提案する効率的なベイズNNのためのFPGAベースのアクセラレータを生成するための変換フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-20T17:08:42Z) - Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - TPU as Cryptographic Accelerator [13.44836928672667]
FHE(Fully Homomorphic Encryption)やZKP(Zero-Knowledge Proofs)のような暗号スキームは、計算の複雑さによってしばしば妨げられる。
本稿では,暗号乗算の高速化にTPU/NPUを活用する可能性について検討し,FHEおよびZKP方式の性能向上を図る。
論文 参考訳(メタデータ) (2023-07-13T04:38:32Z) - GloptiNets: Scalable Non-Convex Optimization with Certificates [61.50835040805378]
本稿では,ハイパーキューブやトーラス上のスムーズな関数を扱う証明書を用いた非キューブ最適化手法を提案する。
スペクトルの減衰に固有の対象関数の正則性を活用することにより、正確な証明を取得し、高度で強力なニューラルネットワークを活用することができる。
論文 参考訳(メタデータ) (2023-06-26T09:42:59Z) - Hardware Acceleration of Explainable Artificial Intelligence [5.076419064097733]
我々は,既存のハードウェアアクセラレーターを用いて,様々なXAIアルゴリズムを高速化する,シンプルかつ効率的なフレームワークを提案する。
提案手法はリアルタイムな結果解釈につながる可能性がある。
論文 参考訳(メタデータ) (2023-05-04T19:07:29Z) - Efficient XAI Techniques: A Taxonomic Survey [40.74369038951756]
我々は、XAI加速の既存の手法を、非アモルト化および効率的なアモルト化法にレビューする。
我々は、トレーニングフェーズ、デプロイメントフェーズ、およびユースケースの観点から、効率的なXAIパイプラインの制限を分析します。
論文 参考訳(メタデータ) (2023-02-07T03:15:38Z) - Gradient Backpropagation based Feature Attribution to Enable
Explainable-AI on the Edge [1.7338677787507768]
そこで本研究では,勾配バックプロパゲーションに基づく特徴属性アルゴリズムのデータフローを解析し,推論に要するリソースのオーバーヘッドを推定する。
我々は,エッジデバイスを対象とした高レベル合成(HLS)に基づくFPGA設計を開発し,3つの特徴帰属アルゴリズムをサポートする。
提案手法は,最小限のオーバーヘッドで特徴属性をサポートするために推論アクセラレータを再利用し,エッジ上でのリアルタイムXAIを実現する経路を示す。
論文 参考訳(メタデータ) (2022-10-19T22:58:59Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Approximation Algorithms for Sparse Principal Component Analysis [57.5357874512594]
主成分分析(PCA)は、機械学習と統計学において広く使われている次元削減手法である。
スパース主成分分析(Sparse principal Component Analysis)と呼ばれる,スパース主成分負荷を求める様々な手法が提案されている。
本研究では,SPCA問題に対するしきい値の精度,時間,近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-23T04:25:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。