論文の概要: Energy-Aware Routing to Large Reasoning Models
- arxiv url: http://arxiv.org/abs/2601.00823v1
- Date: Tue, 23 Dec 2025 17:33:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-11 18:48:17.523562
- Title: Energy-Aware Routing to Large Reasoning Models
- Title(参考訳): 大型共振モデルへのエネルギー・アウェア・ルーティング
- Authors: Austin R. Ellis-Mohr, Max Hartman, Lav R. Varshney,
- Abstract要約: 大きな推論モデル(LRM)は、不均一な推論エネルギーコストを持つ。
エネルギーを低減させるためには、正しいLRMを選択し、正しい方法で操作することが重要である。
- 参考スコア(独自算出の注目度): 12.12696006896269
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large reasoning models (LRMs) have heterogeneous inference energy costs based on which model is used and how much it reasons. To reduce energy, it is important to choose the right LRM and operate it in the right way. As a result, the performance of systems that dispatch tasks to different individual LRMs depend on the balance between mean energy provisioning and stochastic fluctuations. The critical regime is the unique operating point at which neither auxiliary energy nor baseline energy is systematically wasted. Increasing baseline supply shifts the system toward persistent over-supply and baseline-energy waste, while reducing supply induces persistent reliance on auxiliary energy. Yet in this regime, performance remains volatility-limited and so a second-order characterization provides further insights that we develop. Here, performance is governed by how variability is absorbed across time, models, and execution choices. This perspective highlights variance-aware routing and dispatch as a principled design axis, and provides a theoretical basis for developing energy-aware model routing policies. Routing behavior is characterized when dispatch policies are based on training-compute and inference-compute scaling laws for LRMs.
- Abstract(参考訳): 大きな推論モデル(LRMs)は、どのモデルが使われているか、どのくらいの理由があるかに基づいて、不均一な推論エネルギーコストを持つ。
エネルギーを低減させるためには、正しいLRMを選択し、正しい方法で操作することが重要である。
その結果、個々のLEMにタスクをディスパッチするシステムの性能は、平均エネルギー供給と確率的変動のバランスに依存する。
臨界状態は、補助エネルギーもベースラインエネルギーも体系的に無駄にしないユニークな運転点である。
ベースライン供給の増加は、システムの永続的な過剰供給とベースラインエネルギーの無駄に移行し、供給の削減は補助エネルギーへの永続的な依存を引き起こす。
しかし、この体制では、パフォーマンスはボラティリティに制限されるままであり、2階のキャラクタリゼーションは、我々が開発するさらなる洞察を提供する。
ここでは、パフォーマンスは、時間、モデル、実行選択の間で変数がどのように吸収されるかによって管理されます。
この視点は、分散を考慮したルーティングとディスパッチを基本設計軸とし、エネルギーを考慮したモデルルーティングポリシーを開発するための理論的基盤を提供する。
ルーティングの動作は、PRMのトレーニング・計算と推論・計算のスケーリング法則に基づいて、ディスパッチポリシーを特徴付ける。
関連論文リスト
- Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [50.52139512096988]
6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文 参考訳(メタデータ) (2025-05-06T06:46:19Z) - Energy-Weighted Flow Matching for Offline Reinforcement Learning [53.64306385597818]
本稿では, 生成モデルにおけるエネルギー誘導について検討し, 対象分布をp(mathbf x)exp(-beta mathcal E(mathcal x))$, $p(mathbf x)$, $mathcal E(mathcal x)$と定義する。
補助モデルを必要としないエネルギー誘導流を直接学習するEFM(Energy-weighted Flow Match)を導入する。
我々はこの方法論をエネルギー重み付けに拡張する
論文 参考訳(メタデータ) (2025-03-06T21:10:12Z) - Energy-Aware Dynamic Neural Inference [39.04688735618206]
エネルギーハーベスターと有限容量エネルギーストレージを備えたオンデバイス適応型推論システムを提案する。
環境エネルギーの速度が増加するにつれて、エネルギー・信頼性を考慮した制御方式は精度を約5%向上させることが示されている。
我々は、信頼性を意識し、認識できないコントローラを理論的に保証する原則的なポリシーを導出する。
論文 参考訳(メタデータ) (2024-11-04T16:51:22Z) - Optimizing Load Scheduling in Power Grids Using Reinforcement Learning and Markov Decision Processes [0.0]
本稿では,動的負荷スケジューリングの課題に対処する強化学習(RL)手法を提案する。
提案手法は実時間負荷スケジューリングのためのロバストでスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2024-10-23T09:16:22Z) - Decentralized Coordination of Distributed Energy Resources through Local Energy Markets and Deep Reinforcement Learning [1.8434042562191815]
地域エネルギー市場を通じて促進される過渡的エネルギーは、分散的で間接的な需要応答ソリューションを提供する。
本研究ではDRLエージェントを用いてローカルエネルギー市場へのエンドユーザー参加を自動化する。
その結果, 昇降率, 負荷係数, ピーク需要などの指標で評価された, 請求書の減少と純負荷の変動率の低下との間には強い相関関係が示された。
論文 参考訳(メタデータ) (2024-04-19T19:03:33Z) - Multiagent Reinforcement Learning with an Attention Mechanism for
Improving Energy Efficiency in LoRa Networks [52.96907334080273]
ネットワーク規模が大きくなるにつれて、パケット衝突によるLoRaネットワークのエネルギー効率は急激に低下する。
マルチエージェント強化学習(MALoRa)に基づく伝送パラメータ割り当てアルゴリズムを提案する。
シミュレーションの結果,MALoRaはベースラインアルゴリズムと比較してシステムEEを著しく改善することがわかった。
論文 参考訳(メタデータ) (2023-09-16T11:37:23Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。