論文の概要: Hugging Carbon: Quantifying the Training Carbon Emissions of AI Models at Scale
- arxiv url: http://arxiv.org/abs/2605.01549v1
- Date: Sat, 02 May 2026 17:32:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.826788
- Title: Hugging Carbon: Quantifying the Training Carbon Emissions of AI Models at Scale
- Title(参考訳): Hugging Carbon: 大規模AIモデルのトレーニング二酸化炭素排出量の定量化
- Authors: Xinlei Wang, Ruibo Ming, Jing Qiu, Junhua Zhao, Jinjin Gu,
- Abstract要約: Hugging Face (HF) は、炭素会計のための大規模で、一般公開され、監査可能なコーパスである。
我々は,HFオープンソースモデルの集合的トレーニングエミッションを推定するFLOPsベースのフレームワークを提案する。
我々の結果は、最も人気のあるオープンソースモデルのトレーニングの結果、約5.8タイムs104$の二酸化炭素排出量が得られたことを示している。
- 参考スコア(独自算出の注目度): 24.552090932103294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The scaling-law era has transformed artificial intelligence from research into a global industry, but its rapid growth raises concerns over energy usage, carbon emissions, and environmental sustainability. Unlike traditional sectors, the AI industry still lacks systematic carbon accounting methods that support large-scale estimates without reproducing the original model. This leaves open questions about how large the problem is today and how large it might be in the near future. Given that the Hugging Face (HF) platform well represents the broader open-source community, we treat it as a large-scale, publicly accessible, and audit-ready corpus for carbon accounting. We propose a FLOPs-based framework to estimate aggregate training emissions of HF open-source models. Considering their uneven disclosure quality, we introduce a tiered approach to handle incomplete metadata, supported by empirical regressions that verify the statistical significance. Compute is also converted to AI training carbon intensity (ATCI, emissions per compute), a metric to assess the sustainability efficiency of model training. Our results show that training the most popular open-source models (with over 5,000 downloads) has resulted in approximately $5.8\times10^4$ metric tons of carbon emissions. This paper provides a scalable framework for emission estimations and a practical methodology to guide future standards and sustainability strategies in the AI industry.
- Abstract(参考訳): スケーリング法の時代は、人工知能を研究からグローバル産業へと変えてきたが、その急速な成長はエネルギー利用、二酸化炭素排出量、環境の持続可能性に対する懸念を高めている。
従来のセクターとは異なり、AI産業には、オリジナルのモデルを再現することなく大規模な見積もりをサポートする、体系的な炭素会計方法がない。
このことは、現在の問題の大きさと、近い将来にどの程度の大きさになるのか、という疑問を浮き彫りにしている。
Hugging Face(HF)プラットフォームは、オープンソースコミュニティをよく表しているので、炭素会計のための大規模で一般公開され、監査可能なコーパスとして扱います。
我々は,HFオープンソースモデルの集合的トレーニングエミッションを推定するFLOPsベースのフレームワークを提案する。
不均一な開示品質を考慮すると、統計的意義を検証する経験的回帰によって支えられる不完全なメタデータを扱うための階層的アプローチを導入する。
計算はまた、モデルトレーニングの持続可能性効率を評価する指標である、AIトレーニングカーボンインテンシティ(ATCI、計算当たりのエミッション)に変換される。
我々の結果は、最も人気のあるオープンソースモデル(5,000ダウンロード以上)のトレーニングの結果、約5.8\times10^4$の二酸化炭素排出量が得られたことを示している。
本稿では,エミッション推定のためのスケーラブルなフレームワークと,AI産業における将来標準とサステナビリティ戦略の指針となる実践的方法論を提供する。
関連論文リスト
- Evaluating the Environmental Impact of using SLMs and Prompt Engineering for Code Generation [2.2165845825140695]
本稿では,サステナビリティ・ファクターとともにコード生成の精度に異なるエンジニアリング・ストラテジーがどう影響するかを,最初の系統的な実証的研究を行った。
我々は,HumanEval+ベンチマークとMBPP+ベンチマークを用いて,11個のオープンソースモデル(1Bから34Bパラメータ)にまたがる6つの顕著なプロンプト戦略を評価した。
以上の結果から,より単純なプロンプト技術であるChain-of-Thoughtは,推理能力とエネルギー効率のほぼ最適バランスを実現できることが示唆された。
論文 参考訳(メタデータ) (2026-04-03T06:37:51Z) - AI-CARE: Carbon-Aware Reporting Evaluation Metric for AI Models [2.7946918847372277]
本稿では,AI-CARE,エネルギー消費評価ツール,および機械学習モデルの炭素排出量について述べる。
理論的解析と実証的検証を通じて、炭素認識ベンチマークがモデルの相対的なランキングを変えることを実証する。
本提案は,研究コミュニティを透明で多目的な評価に転換し,MLの進歩をグローバルなサステナビリティ目標に合わせることを目的としている。
論文 参考訳(メタデータ) (2026-02-17T21:52:48Z) - OpenCarbonEval: A Unified Carbon Emission Estimation Framework in Large-Scale AI Models [16.93272879722972]
OpenCarbonEvalは、二酸化炭素排出量を予測するために様々なモードで大規模なモデルを統合するためのフレームワークである。
視覚モデルと言語モデルの両方において,OpenCarbonEvalは,二酸化炭素排出量の予測性能に優れることを示す。
論文 参考訳(メタデータ) (2024-05-21T14:50:20Z) - Generative AI for Low-Carbon Artificial Intelligence of Things with Large Language Models [67.0243099823109]
ジェネレーティブAI(GAI)は、AIoT(Artificial Intelligence of Things)の二酸化炭素排出量を減らす大きな可能性を秘めている
本稿では, 炭素排出量削減のためのGAIの可能性について検討し, 低炭素AIoTのための新しいGAI対応ソリューションを提案する。
本稿では,Large Language Model (LLM) を利用したCO_2排出最適化フレームワークを提案し,このフレームワークにより,プラグ可能なLLMとRetrieval Augmented Generation (RAG) モジュールを設計する。
論文 参考訳(メタデータ) (2024-04-28T05:46:28Z) - Green Federated Learning [7.003870178055125]
Federated Learning(FL)は、分散エンティティのデータを使用して集中型モデルをトレーニングする機械学習技術である。
FLは、多様なエネルギー源を持つ数億ものグローバル分散エンドユーザーデバイスを活用することができる。
提案するグリーンFLの概念は, FLパラメータを最適化し, 二酸化炭素排出量を最小化するための設計選択を行うものである。
論文 参考訳(メタデータ) (2023-03-26T02:23:38Z) - Counting Carbon: A Survey of Factors Influencing the Emissions of
Machine Learning [77.62876532784759]
機械学習(ML)は、モデルトレーニングプロセス中に計算を実行するためにエネルギーを使用する必要がある。
このエネルギーの生成には、使用量やエネルギー源によって、温室効果ガスの排出という観点からの環境コストが伴う。
本稿では,自然言語処理とコンピュータビジョンにおいて,95のMLモデルの炭素排出量の時間的および異なるタスクに関する調査を行う。
論文 参考訳(メタデータ) (2023-02-16T18:35:00Z) - Estimating the Carbon Footprint of BLOOM, a 176B Parameter Language
Model [72.65502770895417]
176ビリオンパラメータ言語モデルBLOOMの炭素フットプリントを,そのライフサイクルにわたって定量化する。
BLOOMの最終訓練で約24.7トンのカルボネックが放出されたと推定する。
本稿では,機械学習モデルの炭素フットプリントを正確に推定することの難しさについて論じる。
論文 参考訳(メタデータ) (2022-11-03T17:13:48Z) - Eco2AI: carbon emissions tracking of machine learning models as the
first step towards sustainable AI [47.130004596434816]
eco2AIでは、エネルギー消費の追跡と地域CO2排出量の正当性に重点を置いている。
モチベーションは、サステナブルAIとグリーンAI経路の両方で、AIベースの温室効果ガスの隔離サイクルの概念からもたらされる。
論文 参考訳(メタデータ) (2022-07-31T09:34:53Z) - Measuring the Carbon Intensity of AI in Cloud Instances [91.28501520271972]
我々は,ソフトウェアの炭素強度を測定するための枠組みを提供し,運転中の炭素排出量を測定することを提案する。
私たちは、Microsoft Azureクラウドコンピューティングプラットフォームにおける排出削減のための一連のアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-10T17:04:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。