論文の概要: Carbon-Efficient 3D DNN Acceleration: Optimizing Performance and Sustainability
- arxiv url: http://arxiv.org/abs/2504.09851v1
- Date: Mon, 14 Apr 2025 03:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:50:06.142801
- Title: Carbon-Efficient 3D DNN Acceleration: Optimizing Performance and Sustainability
- Title(参考訳): 炭素効率のよい3D DNN加速:性能と持続可能性の最適化
- Authors: Aikaterini Maria Panteleaki, Konstantinos Balaskas, Georgios Zervakis, Hussam Amrouch, Iraklis Anagnostopoulos,
- Abstract要約: 3D統合はパフォーマンスを向上させるが、持続可能性の問題をもたらす。
本稿では3次元加速器の炭素効率設計手法を提案する。
提案手法は,高い計算精度を維持しつつ,シリコン面積と製造オーバーヘッドを効果的に低減する。
- 参考スコア(独自算出の注目度): 7.059399419316343
- License:
- Abstract: As Deep Neural Networks (DNNs) continue to drive advancements in artificial intelligence, the design of hardware accelerators faces growing concerns over embodied carbon footprint due to complex fabrication processes. 3D integration improves performance but introduces sustainability challenges, making carbon-aware optimization essential. In this work, we propose a carbon-efficient design methodology for 3D DNN accelerators, leveraging approximate computing and genetic algorithm-based design space exploration to optimize Carbon Delay Product (CDP). By integrating area-efficient approximate multipliers into Multiply-Accumulate (MAC) units, our approach effectively reduces silicon area and fabrication overhead while maintaining high computational accuracy. Experimental evaluations across three technology nodes (45nm, 14nm, and 7nm) show that our method reduces embodied carbon by up to 30% with negligible accuracy drop.
- Abstract(参考訳): Deep Neural Networks (DNN) が人工知能の進歩を推し進めている中、ハードウェアアクセラレータの設計は複雑な製造プロセスによる炭素フットプリントへの懸念が高まっている。
3D統合はパフォーマンスを向上するが、持続可能性の問題を導入し、炭素を意識した最適化が不可欠である。
本研究では,炭素遅延生成物(CDP)を最適化するために,近似計算と遺伝的アルゴリズムに基づく設計空間探索を利用した3次元DNN加速器の炭素効率設計手法を提案する。
面積効率のよい近似乗算器をMultiply-Accumulate (MAC) ユニットに統合することにより,高い計算精度を維持しつつ,シリコン面積と製造オーバーヘッドを効果的に低減する。
3つの技術ノード (45nm, 14nm, 7nm) にまたがる実験により, 吸着炭素を最大30%低減し, 精度が低下することを示した。
関連論文リスト
- Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.77822620185878]
本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文 参考訳(メタデータ) (2024-12-03T19:20:08Z) - Beyond Efficiency: Scaling AI Sustainably [4.711003829305544]
現代のAIアプリケーションは、コンピューティングにおける需要を継続的に増加させてきた。
本稿では, ハードウェア製造における炭素排出量の具体化だけでなく, トレーニングおよび推論からのCO排出の操作を含む, AIの炭素影響を特徴付ける。
論文 参考訳(メタデータ) (2024-06-08T00:07:16Z) - GECO: Generative Image-to-3D within a SECOnd [51.20830808525894]
本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。
GECOは、前例のないレベルの効率で高品質な3Dメッシュ生成を実現する。
論文 参考訳(メタデータ) (2024-05-30T17:58:00Z) - Generative AI for Low-Carbon Artificial Intelligence of Things with Large Language Models [67.0243099823109]
ジェネレーティブAI(GAI)は、AIoT(Artificial Intelligence of Things)の二酸化炭素排出量を減らす大きな可能性を秘めている
本稿では, 炭素排出量削減のためのGAIの可能性について検討し, 低炭素AIoTのための新しいGAI対応ソリューションを提案する。
本稿では,Large Language Model (LLM) を利用したCO_2排出最適化フレームワークを提案し,このフレームワークにより,プラグ可能なLLMとRetrieval Augmented Generation (RAG) モジュールを設計する。
論文 参考訳(メタデータ) (2024-04-28T05:46:28Z) - Carbon Intensity-Aware Adaptive Inference of DNNs [0.0]
我々のアルゴリズムは、低強度期間中により大きく、高精度なモデルを使用し、高強度期間中により小さく、より精度の低いモデルを使用する。
また, 炭素フットプリントの観点から, 適応モデル選択の有効性を定量的に測定する指標である炭素放出効率も導入した。
論文 参考訳(メタデータ) (2024-03-23T12:33:12Z) - Photonics for Sustainable Computing [1.7396686601746498]
フォトニック集積回路は、光トランシーバー、LIDAR、バイオセンシング、フォトニック量子コンピューティング、機械学習など、様々な用途で使われている。
本稿では,フォトニクスチップの炭素フットプリントモデルを構築し,フォトニクスベースの加速器の持続可能性について検討する。
解析の結果,光化学は高エネルギー効率で炭素フットプリントの操作性および実施性の両方を低減できることがわかった。
論文 参考訳(メタデータ) (2024-01-10T12:37:23Z) - EPIM: Efficient Processing-In-Memory Accelerators based on Epitome [78.79382890789607]
畳み込みのような機能を提供する軽量神経オペレータであるEpitomeを紹介する。
ソフトウェア側では,PIMアクセラレータ上でのエピトームのレイテンシとエネルギを評価する。
ハードウェア効率を向上させるため,PIM対応層設計手法を提案する。
論文 参考訳(メタデータ) (2023-11-12T17:56:39Z) - Data-Model-Circuit Tri-Design for Ultra-Light Video Intelligence on Edge
Devices [90.30316433184414]
本稿では,HDビデオストリーム上での高スループット,低コスト,高精度MOTのためのデータモデル・ハードウエア・トリデザイン・フレームワークを提案する。
現状のMOTベースラインと比較して、我々の三設計アプローチは12.5倍の遅延低減、20.9倍のフレームレート改善、5.83倍の低消費電力、9.78倍のエネルギー効率を実現でき、精度は低下しない。
論文 参考訳(メタデータ) (2022-10-16T16:21:40Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - DRACO: Co-Optimizing Hardware Utilization, and Performance of DNNs on
Systolic Accelerator [5.65116500037191]
協調最適化(DRACO)を考慮したデータ再利用計算を提案する。
DRACOは、データフロー/マイクロアーキテクチャの変更を必要とせずに、メモリバウンドDNNのPE利用を改善する。
従来の最適化手法とは異なり、DRACOは性能とエネルギー効率を最大化するだけでなく、DNNの予測性能も向上する。
論文 参考訳(メタデータ) (2020-06-26T17:06:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。