論文の概要: Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems
- arxiv url: http://arxiv.org/abs/2605.22883v1
- Date: Wed, 20 May 2026 22:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.020472
- Title: Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems
- Title(参考訳): 成功目標当たりのエネルギー:エージェントAIシステムのためのゴールレベルエネルギー会計
- Authors: Deepak Panigrahy, Aakash Tyagi,
- Abstract要約: 現在のAIエネルギベンチマークは、単一のモデル呼び出しやトレーニング実行の粒度で消費を測定する。
A-LEMS(A-LEMS)は、AIエネルギーの単位を再定義し、推論毎のエネルギーから成功目標毎のエネルギー(EpG)へ変換する。
EpGは、失敗やリトライを含むすべての実行試行にまたがってワークフロー全体のエネルギを集約する。
- 参考スコア(独自算出の注目度): 0.6338178373376447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current AI energy benchmarks measure consumption at the granularity of a single model invocation or training run. For classical single-turn workloads this unit remains coherent. For agentic systems - where a single user goal may trigger multi-step orchestration, tool calls, retries, and failure-recovery cycles - the invocation count is an implementation artifact rather than a task property, and inference-level normalization misrepresents the energy cost of goal completion. We present A-LEMS (Agentic LLM Energy Measurement System), a cross-layer measurement framework that redefines the unit of AI energy accounting from energy per inference to Energy per Successful Goal (EpG). EpG aggregates total workflow energy across all execution attempts, including failures and retries, normalized by successfully completed goals. A-LEMS formalizes energy attribution through a temporal boundary model, a five-layer observation pipeline mapping RAPL signals to workflow-level energy, and a reproducibility protocol binding every measurement to hardware and runtime configuration. Building on EpG, we define the Orchestration Overhead Index (OOI), isolating the energy cost of orchestration relative to linear execution under identical task criteria. Across five reasoning and three tool-augmented task families, agentic workflows consume 4.33x higher mean energy per successful goal than linear baselines (888.1 J vs 205.3 J). This overhead is driven by orchestration structure, not inference compute. For tool-augmented tasks, OOI inverts below 1.0x: agentic execution is cheaper than linear, confirming the metric captures orchestration structure rather than a fixed upward bias. These findings establish that energy-per-inference is insufficient for agentic AI. EpG and OOI provide the measurement foundation for accurate benchmarking, where orchestration structure is the primary determinant of energy cost.
- Abstract(参考訳): 現在のAIエネルギベンチマークは、単一のモデル呼び出しやトレーニング実行の粒度で消費を測定する。
古典的なシングルターンワークロードでは、このユニットはコヒーレントである。
エージェントシステム - 単一のユーザ目標が複数ステップのオーケストレーション、ツールコール、リトライ、障害復旧サイクルをトリガーする可能性がある - 呼び出しカウントはタスクプロパティではなく実装成果物であり、推論レベルの正規化は、ゴール完了のエネルギーコストを誤って表している。
A-LEMS(Agentic LLM Energy Measurement System)は,AIエネルギーの単位を推定毎のエネルギーから成功目標毎のエネルギー(EpG)に再定義する多層計測フレームワークである。
EpGは、失敗やリトライを含むすべての実行試行にまたがってワークフロー全体のエネルギを集約する。
A-LEMSは、時間境界モデル、RAPL信号をワークフローレベルのエネルギーにマッピングする5層観測パイプライン、およびすべての測定をハードウェアとランタイム設定に結合する再現性プロトコルを通じて、エネルギーの寄与を形式化する。
EpGに基づいてオーケストレーションオーバヘッド指数(OOI)を定義し、同一のタスク基準の下での線形実行に対するオーケストレーションのエネルギーコストを分離する。
5つの推論と3つのツール強化タスクファミリでエージェントワークフローは、成功目標あたりの平均エネルギーを線形ベースライン(888.1 J vs 205.3 J)よりも4.33倍高いエネルギーを消費する。
このオーバーヘッドは、推論計算ではなく、オーケストレーション構造によって引き起こされる。
エージェント実行はリニアよりも安価であり、メトリックが固定された上向きバイアスではなく、オーケストレーション構造をキャプチャすることを確認した。
これらの結果から,エージェントAIにはエネルギー・パー・推論が不十分であることが判明した。
EpGとOOIは正確なベンチマークのための測定基盤を提供し、そこではオーケストレーション構造がエネルギーコストの主要な決定要因である。
関連論文リスト
- RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset [48.645870795753105]
ロボットのためのロバスト自動データ取得(RADAR)について紹介する。
RADARは完全に自律的でクローズドループのデータ生成エンジンで、収集サイクルから人間の介入を完全に取り除きます。
シミュレーションでは、複雑な長期タスクにおいて、最大90%の成功率を達成する。
論文 参考訳(メタデータ) (2026-03-12T11:18:52Z) - Beyond Test-Time Compute Strategies: Advocating Energy-per-Token in LLM Inference [1.522424334864671]
大規模言語モデル(LLM)は、様々なタスクにまたがる優れた性能を示すが、かなりのエネルギーと計算コストが伴う。
SLM(Small Language Models)は、単純なテキスト生成タスクに対して正確な応答を提供する。
これらの戦略は追加のエネルギーコストを導入し、エネルギー精度のトレードオフを生み出す。
論文 参考訳(メタデータ) (2026-03-04T15:20:55Z) - Energy-Aware Metaheuristics [0.4231181719953952]
本稿では,固定エネルギー予算の下で機能するエネルギーを考慮したメタヒューリスティックを設計するための基本的枠組みを提案する。
数値ゲインとエネルギー使用量の両方を定量化する統一された演算子レベルモデルを導入し、ジュールスコア毎に頑健な改善を期待する。
我々は、このフレームワークを3つの代表的なメタヒューリスティック(定常GA、PSO、ILS)でインスタンス化する。
論文 参考訳(メタデータ) (2026-02-06T10:47:02Z) - Understanding Efficiency: Quantization, Batching, and Serving Strategies in LLM Energy Use [4.513690948889834]
大規模言語モデル(LLM)はますます本番環境に配備され、計算資源やエネルギー需要の負担をトレーニングから推論へとシフトさせるのに寄与している。
我々は,同じモデルにおけるエネルギー消費のオーダー・オブ・マグニチュードの違いを,Emphsystemレベルの設計選択がいかに引き起こすかを示す。
我々の発見は、よりグリーンなAIサービスのための位相認識エネルギープロファイリングとシステムレベルの最適化を動機付けている。
論文 参考訳(メタデータ) (2026-01-29T22:16:25Z) - MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks [86.05918381895555]
関数呼び出し強化学習問題としてMASオーケストレーションを定式化する訓練時間フレームワークとしてMASOrchestraを提案する。
MAS-Orchestraでは、複雑なゴール指向のサブエージェントは呼び出し可能な関数として抽象化され、システム構造に対する大域的推論を可能にする。
分析の結果,MASはタスク構造や検証プロトコル,オーケストレータとサブエージェントの両方の機能に大きく依存していることが判明した。
論文 参考訳(メタデータ) (2026-01-21T04:57:02Z) - ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.07970070817353]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。
現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。
本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文 参考訳(メタデータ) (2025-08-19T12:13:41Z) - Sustainable LLM Inference for Edge AI: Evaluating Quantized LLMs for Energy Efficiency, Output Accuracy, and Inference Latency [6.306413686006502]
我々はOllamaライブラリから28の量子化大言語モデル(LLM)を包括的に分析する。
我々は、複数の量子化レベルおよびタスクタイプにわたるエネルギー効率、推論性能、出力精度を評価する。
その結果,異なる量子化設定におけるエネルギー効率,推定速度,精度のトレードオフが明らかになった。
論文 参考訳(メタデータ) (2025-04-04T11:29:30Z) - Power Hungry Processing: Watts Driving the Cost of AI Deployment? [74.19749699665216]
生成された多目的AIシステムは、機械学習(ML)モデルをテクノロジに構築するための統一的なアプローチを約束する。
この「一般性」の野心は、これらのシステムが必要とするエネルギー量と放出する炭素量を考えると、環境に急激なコストがかかる。
これらのモデルを用いて,代表的なベンチマークデータセット上で1,000の推論を行うのに必要なエネルギーと炭素の量として,デプロイメントコストを測定した。
本稿は、多目的MLシステムの展開動向に関する議論から締めくくり、エネルギーと排出の面でコストの増大に対して、その実用性はより意図的に重み付けされるべきである、と警告する。
論文 参考訳(メタデータ) (2023-11-28T15:09:36Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。