論文の概要: Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey
- arxiv url: http://arxiv.org/abs/2604.07857v1
- Date: Thu, 09 Apr 2026 06:13:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.734522
- Title: Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey
- Title(参考訳): エージェントAI推論におけるネットワーク対応エネルギー効率:サーベイ
- Authors: Xiaojing Chen, Haiqi Yu, Wei Ni, Dusit Niyato, Ruichen Zhang, Xin Wang, Shunqing Zhang, Shugong Xu,
- Abstract要約: 本稿では,知覚・推論・行動サイクル全体にわたる計算・通信コストを同定するエネルギー会計フレームワークを提案する。
我々は、単純化、計算制御、インプット・アンド・アテンション最適化、ハードウェア・アウェア・推論にまたがる統一的な分類法を確立する。
我々は,第6世代移動通信(6G)ネイティブエージェントAI,自己維持システムといったグリーンラーニングのオープンな課題を特定した。
- 参考スコア(独自算出の注目度): 64.20429885919701
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid emergence of Large Language Models (LLMs) has catalyzed Agentic artificial intelligence (AI), autonomous systems integrating perception, reasoning, and action into closed-loop pipelines for continuous adaptation. While unlocking transformative applications in mobile edge computing, autonomous systems, and next-generation wireless networks, this paradigm creates fundamental energy challenges through iterative inference and persistent data exchange. Unlike traditional AI where bottlenecks are computational Floating Point Operations (FLOPs), Agentic AI faces compounding computational and communication energy costs. In this survey, we propose an energy accounting framework identifying computational and communication costs across the Perception-Reasoning-Action cycle. We establish a unified taxonomy spanning model simplification, computation control, input and attention optimization, and hardware-aware inference. We explore cross-layer co-design strategies jointly optimizing model parameters, wireless transmissions, and edge resources. Finally, we identify open challenges of federated green learning, carbon-aware agency, 6th generation mobile communication (6G)-native Agentic AI, and self-sustaining systems, providing a roadmap for scalable autonomous intelligence.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な台頭はエージェント人工知能(AI)を触媒し、認識、推論、アクションを連続的な適応のためにクローズドループパイプラインに統合する自律システムとなった。
モバイルエッジコンピューティング、自律システム、次世代無線ネットワークにおけるトランスフォーメーションアプリケーションをアンロックする一方で、このパラダイムは反復推論と永続データ交換を通じて基本的なエネルギー課題を生み出す。
ボトルネックが計算浮動小数点演算(FLOP)である従来のAIとは異なり、エージェントAIは計算と通信のエネルギーコストの複合化に直面している。
本研究では,知覚・推論・行動サイクル全体にわたる計算・通信コストを同定するエネルギー会計フレームワークを提案する。
我々は、単純化、計算制御、インプット・アンド・アテンション最適化、ハードウェア・アウェア・推論にまたがる統一的な分類法を確立する。
モデルパラメータ,無線送信,エッジリソースを協調的に最適化する多層共設計戦略について検討する。
最後に,フェデレートグリーンラーニング,カーボンアウェアエージェンシー,第6世代モバイル通信(6G)ネイティブエージェントAI,自己維持システムといったオープンな課題を特定し,スケーラブルな自律型インテリジェンスのためのロードマップを提供する。
関連論文リスト
- Federated Agentic AI for Wireless Networks: Fundamentals, Approaches, and Applications [60.721304295812445]
フェデレートラーニング(FL)はエージェントAIの全体的なループを改善する可能性がある。
まず、エージェントAIとメインストリームのFLタイプの基礎を要約し、各FLタイプがエージェントAIのループの特定のコンポーネントを強化する方法について説明する。
低高度無線ネットワークにおけるエージェントAIの動作決定性能を向上させるためにFRLを用いたケーススタディを行う。
論文 参考訳(メタデータ) (2026-03-02T11:26:56Z) - Adaptive and Resource-efficient Agentic AI Systems for Mobile and Embedded Devices: A Survey [11.537225726120495]
ファンデーションモデルは、断片化されたアーキテクチャをマルチモーダル推論とコンテキスト適応を備えたスケーラブルなバックボーンに統一することで、AIを再構築した。
FMを認知のコアとして、エージェントは自律性、一般化、自己回帰を達成するためにルールベースの振る舞いを超越する。
この調査は、適応的でリソース効率の良いエージェントAIシステムの、最初の体系的な特徴を提供する。
論文 参考訳(メタデータ) (2025-09-30T02:37:52Z) - PANAMA: A Network-Aware MARL Framework for Multi-Agent Path Finding in Digital Twin Ecosystems [0.0]
ネットワークマルチエージェント強化学習(MARL)に基づくマルチエージェントパス探索(MAPF)のための優先非対称性を持つ新しいアルゴリズムであるPANAMAを紹介する。
提案手法は,既存のベンチマークと比較して,精度,速度,スケーラビリティにおいて優れたパスフィンディング性能を示す。
PanAMAは、ネットワーク対応意思決定と堅牢なマルチエージェント調整のギャップを埋め、DT、無線ネットワーク、AI駆動自動化のシナジーを前進させる。
論文 参考訳(メタデータ) (2025-08-09T00:59:55Z) - AI Flow: Perspectives, Scenarios, and Approaches [51.38621621775711]
私たちは最先端のITとCTの進歩を統合するフレームワークであるAI Flowを紹介します。
まず、デバイスエッジクラウドフレームワークは、エンドデバイス、エッジサーバ、クラウドクラスタを統合する基盤として機能する。
第2に,家族モデルの概念を導入し,同列に隠れた特徴を持つ様々なサイズのモデルに言及する。
第3に、コネクティビティとインタラクションに基づくインテリジェンスの出現は、AI Flowの新たなパラダイムである。
論文 参考訳(メタデータ) (2025-06-14T12:43:07Z) - INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization [43.37351326629751]
インネットワークAI(In-network AI)は、ネットワークインフラストラクチャにおける人工知能(AI)のエスカレート要求に対処するための、変革的なアプローチである。
本稿では,AIのためのネットワーク内計算の最適化に関する包括的な分析を行う。
リソース制約のあるネットワークデバイスにAIモデルをマッピングするための方法論を調べ、メモリや計算能力の制限といった課題に対処する。
論文 参考訳(メタデータ) (2025-05-30T06:47:55Z) - Toward Agentic AI: Generative Information Retrieval Inspired Intelligent Communications and Networking [87.82985288731489]
Agentic AIは、インテリジェントなコミュニケーションとネットワークのための重要なパラダイムとして登場した。
本稿では,通信システムにおけるエージェントAIにおける知識獲得,処理,検索の役割を強調する。
論文 参考訳(メタデータ) (2025-02-24T06:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。