論文の概要: XWind: A Cross-site Router for Large Language Model Inference Serving at Renewable Energy Farms
- arxiv url: http://arxiv.org/abs/2605.23348v1
- Date: Fri, 22 May 2026 08:08:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.257592
- Title: XWind: A Cross-site Router for Large Language Model Inference Serving at Renewable Energy Farms
- Title(参考訳): XWind:再生可能エネルギーファームにおける大規模言語モデル推論のためのクロスサイトルータ
- Authors: Tella Rajashekhar Reddy, Atharva Deshmukh, Liangcheng Yu, Chaojie Zhang, Mike Shepperd, Rohan Gandhi, Anjaly Parayil, Srinivasan Iyengar, Ajay Manchepalli, Debopam Bhattacherjee,
- Abstract要約: AIの電力需要は前例のないペースで伸びている。
グリッドの拡大には高い資本支出と長距離送電損失が伴うが、供給源には再生可能エネルギーが豊富にある。
本稿では,再生可能エネルギー源にモジュール型AI計算をもたらす,補完的なAIインフラストラクチャ展開モデルであるAI Greenferenceを提案する。
- 参考スコア(独自算出の注目度): 3.501042061379414
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: AI power demand is growing at an unprecedented rate while power grids are often ailing and struggle to keep up. Grid expansion comes with high capital expenditure and long-distance transmission losses, yet there is abundant renewable energy at the source, just not matched to demand. This paper proposes a complementary AI infrastructure deployment model, AI Greenferencing, that brings modular AI compute to renewable energy sources, focusing on wind, allowing AI footprint expansion, generating local behind-the-meter demand for renewable sites, and helping ease the growing strain on power utilities. Our feasibility analysis shows that 890+ GW of wind capacity lies within 50 ms network round trip time of Azure data centers, and that site-wise right-sizing combined with spatial complementarity of wind energy keeps aggregate fleet utilization on par with traditional deployments. To serve inference requests under variable wind power, we build XWind, a lightweight, reactive, and workload-agnostic AI inference router that uses only real-time signals: inference latency, KV-cache utilization, and queue depth, to dynamically configure sites and distribute requests. Evaluated on a real 64-GPU A100 testbed emulating three wind-powered sites with Azure production traces, XWind reduces P99 end-to-end latency by up to 52% over the strongest contender (also our idea) and by up to 98% over baselines such as power-capping and GPU idling, with consistent gains across workload types, load levels, and GPU generations.
- Abstract(参考訳): AIの電力需要は前例のないペースで伸びている。
グリッドの拡大には高い資本支出と長距離送電損失が伴うが、供給源には再生可能エネルギーが豊富にある。
本稿では、再生可能エネルギー源にモジュール型AI計算を導入し、風に焦点をあて、AIフットプリントの拡大を可能にし、再生可能サイトのローカルな後方需要を発生させ、電力ユーティリティの増大を緩和する、補完的なAIインフラストラクチャ展開モデルであるAI Greenferenceを提案する。
我々の実現可能性分析は、風力容量890GWが、Azureデータセンターの50msネットワークのラウンドトリップタイム内にあり、風力エネルギーの空間的相補性とサイトワイドな右サイズが、従来の展開と同等の総艦隊利用を維持できることを示している。
可変風力下での推論要求を提供するために、我々はXWindを構築した。XWindは軽量でリアクティブでワークロードに依存しないAI推論ルータで、推論レイテンシ、KV-cache利用、キューの深さといったリアルタイム信号のみを使用して、サイトを動的に設定し、リクエストを配布する。
XWindは、実際の64-GPU A100テストベッドで、Azureのプロダクショントレースを備えた3つの風力サイトをエミュレートし、P99のエンドツーエンドのレイテンシを、最強の競合者(これも私たちのアイデア)よりも最大52%削減し、電力キャッシュやGPUアイドリングといったベースラインを最大98%削減し、ワークロードタイプ、ロードレベル、GPU世代間で一貫した改善を実現した。
関連論文リスト
- Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey [64.20429885919701]
本稿では,知覚・推論・行動サイクル全体にわたる計算・通信コストを同定するエネルギー会計フレームワークを提案する。
我々は、単純化、計算制御、インプット・アンド・アテンション最適化、ハードウェア・アウェア・推論にまたがる統一的な分類法を確立する。
我々は,第6世代移動通信(6G)ネイティブエージェントAI,自己維持システムといったグリーンラーニングのオープンな課題を特定した。
論文 参考訳(メタデータ) (2026-04-09T06:13:59Z) - AI Greenferencing: Routing AI Inferencing to Green Modular Data Centers with Heron [3.847328366489219]
本稿では、風力発電所で共同配置されたモジュール型計算クラスタにAIワークロードを組み込むことを論じる。
私たちは、風力発電の相補性を効果的に活用できるクロスサイトソフトウェアルータHeronを開発しました。
We show how Heron improves aggregate goodput of AI compute than the state-of-the-art。
論文 参考訳(メタデータ) (2025-05-15T06:03:47Z) - Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [50.52139512096988]
6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文 参考訳(メタデータ) (2025-05-06T06:46:19Z) - Green Edge AI: A Contemporary Survey [46.11332733210337]
AIの変換力は、ディープニューラルネットワーク(DNN)の利用から導かれる。
ディープラーニング(DL)は、エンドユーザーデバイス(EUD)に近い無線エッジネットワークに移行しつつある。
その可能性にもかかわらず、エッジAIは大きな課題に直面している。主な原因は、無線エッジネットワークのリソース制限と、DLのリソース集約的な性質の分離である。
論文 参考訳(メタデータ) (2023-12-01T04:04:37Z) - Long-term Wind Power Forecasting with Hierarchical Spatial-Temporal
Transformer [112.12271800369741]
風力発電は、再生可能、汚染のないその他の利点により、世界中の注目を集めている。
正確な風力発電予測(WPF)は、電力系統の運用における電力変動を効果的に低減することができる。
既存の手法は主に短期的な予測のために設計されており、効果的な時空間的特徴増強が欠如している。
論文 参考訳(メタデータ) (2023-05-30T04:03:15Z) - Predicting Short Term Energy Demand in Smart Grid: A Deep Learning Approach for Integrating Renewable Energy Sources in Line with SDGs 7, 9, and 13 [0.0]
スマートパワーグリッドにおけるエネルギー需要予測のためのディープラーニングモデルを提案する。
我々は、長期記憶ネットワークを使用して、エネルギー需要データにおける複雑なパターンや依存関係をキャプチャします。
提案モデルでは,平均絶対誤差 1.4% でエネルギー需要を正確に予測できる。
論文 参考訳(メタデータ) (2023-04-08T12:30:59Z) - Distributed Energy Management and Demand Response in Smart Grids: A
Multi-Agent Deep Reinforcement Learning Framework [53.97223237572147]
本稿では、自律制御と再生可能エネルギー資源のスマート電力グリッドシステムへの統合のための多エージェント深層強化学習(DRL)フレームワークを提案する。
特に,提案フレームワークは,住宅利用者に対する需要応答 (DR) と分散エネルギー管理 (DEM) を共同で検討している。
論文 参考訳(メタデータ) (2022-11-29T01:18:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。