論文の概要: Carbon-Efficient 3D DNN Acceleration: Optimizing Performance and Sustainability
- arxiv url: http://arxiv.org/abs/2504.09851v1
- Date: Mon, 14 Apr 2025 03:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-22 23:48:11.918736
- Title: Carbon-Efficient 3D DNN Acceleration: Optimizing Performance and Sustainability
- Title(参考訳): 炭素効率のよい3D DNN加速:性能と持続可能性の最適化
- Authors: Aikaterini Maria Panteleaki, Konstantinos Balaskas, Georgios Zervakis, Hussam Amrouch, Iraklis Anagnostopoulos,
- Abstract要約: 3D統合はパフォーマンスを向上させるが、持続可能性の問題をもたらす。
本稿では3次元加速器の炭素効率設計手法を提案する。
提案手法は,高い計算精度を維持しつつ,シリコン面積と製造オーバーヘッドを効果的に低減する。
- 参考スコア(独自算出の注目度): 7.059399419316343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As Deep Neural Networks (DNNs) continue to drive advancements in artificial intelligence, the design of hardware accelerators faces growing concerns over embodied carbon footprint due to complex fabrication processes. 3D integration improves performance but introduces sustainability challenges, making carbon-aware optimization essential. In this work, we propose a carbon-efficient design methodology for 3D DNN accelerators, leveraging approximate computing and genetic algorithm-based design space exploration to optimize Carbon Delay Product (CDP). By integrating area-efficient approximate multipliers into Multiply-Accumulate (MAC) units, our approach effectively reduces silicon area and fabrication overhead while maintaining high computational accuracy. Experimental evaluations across three technology nodes (45nm, 14nm, and 7nm) show that our method reduces embodied carbon by up to 30% with negligible accuracy drop.
- Abstract(参考訳): Deep Neural Networks (DNN) が人工知能の進歩を推し進めている中、ハードウェアアクセラレータの設計は複雑な製造プロセスによる炭素フットプリントへの懸念が高まっている。
3D統合はパフォーマンスを向上するが、持続可能性の問題を導入し、炭素を意識した最適化が不可欠である。
本研究では,炭素遅延生成物(CDP)を最適化するために,近似計算と遺伝的アルゴリズムに基づく設計空間探索を利用した3次元DNN加速器の炭素効率設計手法を提案する。
面積効率のよい近似乗算器をMultiply-Accumulate (MAC) ユニットに統合することにより,高い計算精度を維持しつつ,シリコン面積と製造オーバーヘッドを効果的に低減する。
3つの技術ノード (45nm, 14nm, 7nm) にまたがる実験により, 吸着炭素を最大30%低減し, 精度が低下することを示した。
関連論文リスト
- iFlame: Interleaving Full and Linear Attention for Efficient Mesh Generation [49.8026360054331]
iFlameはメッシュ生成のためのトランスフォーマーベースの新しいネットワークアーキテクチャである。
本稿では,線形アテンションの効率とフルアテンション機構の表現力を組み合わせたインターリービング自己回帰メッシュ生成フレームワークを提案する。
提案するインターリービングフレームワークは,計算効率と生成性能を効果的にバランスさせることが示唆された。
論文 参考訳(メタデータ) (2025-03-20T19:10:37Z) - AOLO: Analysis and Optimization For Low-Carbon Oriented Wireless Large Language Model Services [14.664814078159282]
大規模言語モデル (LLM) は、エネルギー消費と炭素フットプリントの大幅な増加により、懸念が高まっている。
低炭素指向の無線LLMサービスの解析と最適化のためのフレームワークであるAOLOを提案する。
AOLOは、LLMサービスチェーン全体にわたる温室効果ガス排出量を定量化する包括的な炭素フットプリントモデルを導入している。
SNNに基づく深部強化学習(SDRL)という低炭素指向最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-06T13:21:38Z) - Ecomap: Sustainability-Driven Optimization of Multi-Tenant DNN Execution on Edge Servers [0.44784055850794474]
本稿では,実時間炭素強度に基づいてエッジデバイスの最大出力閾値を調整するフレームワークであるEcomapを紹介する。
NVIDIA Jetson AGX Xavierを用いた実験の結果、Ecomapは二酸化炭素排出量を平均30%削減することが示された。
論文 参考訳(メタデータ) (2025-03-06T06:56:51Z) - Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.77822620185878]
本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文 参考訳(メタデータ) (2024-12-03T19:20:08Z) - Beyond Efficiency: Scaling AI Sustainably [4.711003829305544]
現代のAIアプリケーションは、コンピューティングにおける需要を継続的に増加させてきた。
本稿では, ハードウェア製造における炭素排出量の具体化だけでなく, トレーニングおよび推論からのCO排出の操作を含む, AIの炭素影響を特徴付ける。
論文 参考訳(メタデータ) (2024-06-08T00:07:16Z) - GECO: Generative Image-to-3D within a SECOnd [51.20830808525894]
本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。
GECOは、前例のないレベルの効率で高品質な3Dメッシュ生成を実現する。
論文 参考訳(メタデータ) (2024-05-30T17:58:00Z) - Generative AI for Low-Carbon Artificial Intelligence of Things with Large Language Models [67.0243099823109]
ジェネレーティブAI(GAI)は、AIoT(Artificial Intelligence of Things)の二酸化炭素排出量を減らす大きな可能性を秘めている
本稿では, 炭素排出量削減のためのGAIの可能性について検討し, 低炭素AIoTのための新しいGAI対応ソリューションを提案する。
本稿では,Large Language Model (LLM) を利用したCO_2排出最適化フレームワークを提案し,このフレームワークにより,プラグ可能なLLMとRetrieval Augmented Generation (RAG) モジュールを設計する。
論文 参考訳(メタデータ) (2024-04-28T05:46:28Z) - LitE-SNN: Designing Lightweight and Efficient Spiking Neural Network through Spatial-Temporal Compressive Network Search and Joint Optimization [48.41286573672824]
スパイキングニューラルネットワーク(SNN)は人間の脳の情報処理機構を模倣し、エネルギー効率が高い。
本稿では,空間圧縮と時間圧縮の両方を自動ネットワーク設計プロセスに組み込むLitE-SNNという新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-26T05:23:11Z) - EPIM: Efficient Processing-In-Memory Accelerators based on Epitome [78.79382890789607]
畳み込みのような機能を提供する軽量神経オペレータであるEpitomeを紹介する。
ソフトウェア側では,PIMアクセラレータ上でのエピトームのレイテンシとエネルギを評価する。
ハードウェア効率を向上させるため,PIM対応層設計手法を提案する。
論文 参考訳(メタデータ) (2023-11-12T17:56:39Z) - Data-Model-Circuit Tri-Design for Ultra-Light Video Intelligence on Edge
Devices [90.30316433184414]
本稿では,HDビデオストリーム上での高スループット,低コスト,高精度MOTのためのデータモデル・ハードウエア・トリデザイン・フレームワークを提案する。
現状のMOTベースラインと比較して、我々の三設計アプローチは12.5倍の遅延低減、20.9倍のフレームレート改善、5.83倍の低消費電力、9.78倍のエネルギー効率を実現でき、精度は低下しない。
論文 参考訳(メタデータ) (2022-10-16T16:21:40Z) - DRACO: Co-Optimizing Hardware Utilization, and Performance of DNNs on
Systolic Accelerator [5.65116500037191]
協調最適化(DRACO)を考慮したデータ再利用計算を提案する。
DRACOは、データフロー/マイクロアーキテクチャの変更を必要とせずに、メモリバウンドDNNのPE利用を改善する。
従来の最適化手法とは異なり、DRACOは性能とエネルギー効率を最大化するだけでなく、DNNの予測性能も向上する。
論文 参考訳(メタデータ) (2020-06-26T17:06:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。