論文の概要: The Language-Energy Divide: Measuring Energy Costs of Multilingual LLM Inference
- arxiv url: http://arxiv.org/abs/2606.21869v1
- Date: Sat, 20 Jun 2026 04:12:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 02:35:25.110837
- Title: The Language-Energy Divide: Measuring Energy Costs of Multilingual LLM Inference
- Title(参考訳): 言語エネルギーディバイド:多言語LLM推論のエネルギーコストの測定
- Authors: Naihao Deng, Alissa Shen, Yiming Feng, Joan Nwatu, Jae-Won Chung, Mosharaf Chowdhury, Yulong Chen, Rada Mihalcea,
- Abstract要約: 大規模言語モデル(LLM)は、多言語設定でますます多くデプロイされている。
しかし、これらのモデルが様々な言語にまたがるエネルギーコストは、いまだに理解されていない。
ML.Energyフレームワークを用いた言語間における推論エネルギー消費の系統的研究を行った。
- 参考スコア(独自算出の注目度): 36.405719100559914
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) are increasingly deployed in multilingual settings, yet the energy costs of serving these models across different languages remain poorly understood. We present a systematic study of inference energy consumption across languages with ML.Energy framework (Chung et al., 2026). We find striking disparities: energy consumption per output token varies by up to 8.3 times across languages, while total energy for a fixed set of requests varies by up to 179 times between the cheapest (English, 17.6 kJ) and the most expensive (Pashto, 3,147 kJ) languages. Our analysis shows that this disparity is driven by two compounding factors: (1) higher per-token energy costs for languages using complex or rare scripts, and (2) more tokens generated for low-resource languages. Moreover, we find a double cost + performance penalty: languages with the highest energy footprints also tend to achieve the lowest task accuracy. We reveal that the energy divide persists across models, hardware, and tasks, suggesting a systemic energy inequity in multilingual LLM deployment. Finally, we recommend that the community treat energy as a first-class evaluation axis, extend reporting checklists and model cards to include it, and adopt deployment-side mitigations for better energy efficiency.
- Abstract(参考訳): 大規模言語モデル(LLM)は多言語化が進んでいるが、これらのモデルが様々な言語にまたがるエネルギーコストはいまだに理解されていない。
ML.Energy framework (Chung et al , 2026。
出力トークン当たりのエネルギー消費は言語間で最大8.3倍、固定された要求の総エネルギーは最も安い(17.6kJ)と最も高価な(Pashto, 3,147kJ)言語の間で最大179倍まで変化する。
この差は,(1)複雑なスクリプトや稀なスクリプトを用いた言語では,トーケン毎のエネルギーコストが高く,(2)低リソース言語ではより多くのトークンが生成される,という2つの複合的要因によって引き起こされている。
エネルギーフットプリントが最も高い言語は、タスクの精度も低い傾向にある。
エネルギー分割はモデル,ハードウェア,タスク間で持続し,多言語LLM展開における系統的エネルギー不等式が示唆される。
最後に、コミュニティはエネルギーを第一級評価軸として扱うこと、チェックリストとモデルカードを拡張して含めること、エネルギー効率を向上させるためにデプロイメントサイドの緩和を採用することを推奨する。
関連論文リスト
- Equity with Efficiency: An Empirical Study of Tokenizers for Multilingual Large Language Models [30.7730386396743]
バイトレベルのByte-Pairトークンは、構造的に高ソース言語とラテン文字を好んでいる。
表現不足の言語話者にとって、このバイアスは推論コストを膨らませ、言語間能力ギャップを拡大する。
東南アジアの11言語にまたがるベンチマークにおいて, 等価なトークン化剤の最初の体系的比較を行った。
論文 参考訳(メタデータ) (2026-06-13T01:10:42Z) - Who Wins the Race? (R Vs Python) - An Exploratory Study on Energy Consumption of Machine Learning Algorithms [5.294137281815185]
本稿では、機械学習モデルトレーニングと推論に異なるプログラミング言語を採用する際のエネルギーコストの意識を高めることを目的とする。
その結果,95%の症例において,両言語間のコストの統計的に有意な差が認められた。
プログラミング言語の選択は、モデルトレーニング中に99.16%まで、推論時に99.8%まで、エネルギー効率に大きな影響を与える可能性がある。
論文 参考訳(メタデータ) (2025-08-24T12:59:47Z) - Breaking Language Barriers in Multilingual Mathematical Reasoning: Insights and Observations [59.056367787688146]
本稿では, マルチリンガル数学推論 (xMR) LLM の探索と学習の先駆者である。
我々は10の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
翻訳を利用して、10個の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
論文 参考訳(メタデータ) (2023-10-31T08:09:20Z) - GreenPLM: Cross-Lingual Transfer of Monolingual Pre-Trained Language
Models at Almost No Cost [7.510253441699812]
本研究では,両言語レキシコンを用いて事前学習した言語モデルを直接他の言語に翻訳するGreenPLMというフレームワークを提案する。
このアプローチを18言語のBERTモデルで検証し、このフレームワークが、トレーニングコストの高い他のフレームワークに匹敵するものであることを示す。
7つのテスト言語のうち6つで、このフレームワークは、トレーニング前の最大200倍の労力で、元のモノリンガル言語モデルより優れています。
論文 参考訳(メタデータ) (2022-11-13T18:59:15Z) - Cross-lingual Machine Reading Comprehension with Language Branch
Knowledge Distillation [105.41167108465085]
言語間機械読解(CLMRC)は、ローソース言語に大規模なデータセットがないため、依然として難しい問題である。
本稿では,Language Branch Machine Reading (LBMRC) という新しい拡張手法を提案する。
LBMRCは、個々の言語に精通したMultiple Machine Read comprehension (MRC)モデルを訓練する。
複数の言語分岐モデルから全ての対象言語に対する単一モデルへのアマルガメート知識の多言語蒸留アプローチを考案する。
論文 参考訳(メタデータ) (2020-10-27T13:12:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。