論文の概要: Adaptive AI Agent Placement and Migration in Edge Intelligence Systems
- arxiv url: http://arxiv.org/abs/2508.03345v1
- Date: Tue, 05 Aug 2025 11:47:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.940404
- Title: Adaptive AI Agent Placement and Migration in Edge Intelligence Systems
- Title(参考訳): エッジインテリジェンスシステムにおける適応型AIエージェント配置とマイグレーション
- Authors: Xingdan Wang, Jiayi He, Zhiqing Tang, Jianxiong Guo, Jiong Lou, Liping Qian, Tian Wang, Weijia Jia,
- Abstract要約: 本稿では,エッジインテリジェンスシステムにおけるAIエージェント配置とマイグレーションのための新しいフレームワークを提案する。
エージェントを自律的に配置してリソース利用を最適化し、必須状態のみを転送することで、軽量なエージェントマイグレーションを可能にする。
- 参考スコア(独自算出の注目度): 14.789027376038115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rise of LLMs such as ChatGPT and Claude fuels the need for AI agents capable of real-time task handling. However, migrating data-intensive, multi-modal edge workloads to cloud data centers, traditionally used for agent deployment, introduces significant latency. Deploying AI agents at the edge improves efficiency and reduces latency. However, edge environments present challenges due to limited and heterogeneous resources. Maintaining QoS for mobile users necessitates agent migration, which is complicated by the complexity of AI agents coordinating LLMs, task planning, memory, and external tools. This paper presents the first systematic deployment and management solution for LLM-based AI agents in dynamic edge environments. We propose a novel adaptive framework for AI agent placement and migration in edge intelligence systems. Our approach models resource constraints and latency/cost, leveraging ant colony algorithms and LLM-based optimization for efficient decision-making. It autonomously places agents to optimize resource utilization and QoS and enables lightweight agent migration by transferring only essential state. Implemented on a distributed system using AgentScope and validated across globally distributed edge servers, our solution significantly reduces deployment latency and migration costs.
- Abstract(参考訳): ChatGPTやClaudeといったLLMの台頭は、リアルタイムタスクハンドリングが可能なAIエージェントの必要性を増している。
しかしながら、データ集約型のマルチモーダルエッジワークロードを、従来はエージェントデプロイメントに使用されていたクラウドデータセンタに移行することで、大きな遅延が発生している。
AIエージェントをエッジにデプロイすることで効率が向上し、レイテンシが削減される。
しかし、エッジ環境は限られた異種資源による課題を呈している。
モバイルユーザのためのQoSを維持するにはエージェントマイグレーションが必要である。これは、LLMをコーディネートするAIエージェント、タスク計画、メモリ、外部ツールの複雑さによって複雑になる。
本稿では, LLMベースのAIエージェントを動的エッジ環境に配置し, 管理する手法を提案する。
本稿では,エッジインテリジェンスシステムにおけるAIエージェントの配置とマイグレーションのための新しい適応フレームワークを提案する。
提案手法は資源制約とレイテンシ/コストをモデル化し,効率的な意思決定のためにアリコロニーアルゴリズムとLLMに基づく最適化を利用する。
エージェントを自律的に配置し、リソース利用とQoSを最適化し、必須状態のみを転送することで、軽量なエージェントマイグレーションを可能にする。
AgentScopeを使って分散システムに実装し、グローバルに分散したエッジサーバで検証することで、当社のソリューションはデプロイメントのレイテンシとマイグレーションコストを大幅に削減します。
関連論文リスト
- Symbiotic Agents: A Novel Paradigm for Trustworthy AGI-driven Networks [2.5782420501870296]
大規模言語モデル(LLM)に基づく自律エージェントは、6Gネットワークの進化において重要な役割を果たすことが期待されている。
我々は、LLMのリアルタイム最適化アルゴリズムをTrustworthy AIに組み合わせた新しいエージェントパラダイムを導入する。
本稿では,AGIネットワークのエンドツーエンドアーキテクチャを提案し,移動車からのチャネル変動をキャプチャする5Gテストベッド上で評価する。
論文 参考訳(メタデータ) (2025-07-23T17:01:23Z) - The Real Barrier to LLM Agent Usability is Agentic ROI [110.31127571114635]
大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。
我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
論文 参考訳(メタデータ) (2025-05-23T11:40:58Z) - Confidence-Regulated Generative Diffusion Models for Reliable AI Agent Migration in Vehicular Metaverses [55.70043755630583]
車両用AIエージェントには、環境認識、意思決定、行動実行能力が与えられている。
本稿では、信頼性の高い車両用AIエージェントマイグレーションフレームワークを提案し、信頼性の高い動的マイグレーションと効率的なリソーススケジューリングを実現する。
我々は,AIエージェントのマイグレーション決定を効率的に生成する信頼性制御型生成拡散モデル(CGDM)を開発した。
論文 参考訳(メタデータ) (2025-05-19T05:04:48Z) - Bi-LSTM based Multi-Agent DRL with Computation-aware Pruning for Agent Twins Migration in Vehicular Embodied AI Networks [20.574619097682923]
インテリジェントトランスポートでは、大型言語モデルと組み込み人工知能(AI)の組み合わせにより、Vehicular Embodied AI Network(VEAN)が生成される。
VEANでは、自律走行車(AV)が典型的なエージェントであり、局所的な高度なAIアプリケーションは車載型AIエージェントとして定義される。
レイテンシとリソースの制約のため、車載型AIエージェント上で動作するローカルAIアプリケーションとサービスを移行する必要がある。
論文 参考訳(メタデータ) (2025-05-09T18:52:26Z) - UserCentrix: An Agentic Memory-augmented AI Framework for Smart Spaces [8.111700384985356]
エージェントAIは、自律的で積極的な意思決定とともに、スマート環境を変革した。
本稿では、動的でコンテキスト対応な意思決定を通じてスマートスペースを強化するために設計された、エージェント型メモリ拡張AIフレームワークであるUserCentrixを紹介する。
論文 参考訳(メタデータ) (2025-05-01T11:54:49Z) - AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。
静的ロールや集中制御の以前のアプローチとは異なり、AgentNetはエージェントがローカルの専門知識とコンテキストに基づいて接続とタスクのルーティングを調整することができる。
実験の結果,AgentNetは単一エージェントと集中型マルチエージェントのベースラインよりも高いタスク精度を実現することがわかった。
論文 参考訳(メタデータ) (2025-04-01T09:45:25Z) - Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization [62.16747639440893]
大規模言語モデル(LLM)とその関連技術は、特に迅速な工学とエージェント工学の領域において進歩している。
提案するフレームワークは、検索拡張生成(RAG)を組み込んで、ドメイン固有の知識を取得してソリューションを生成するシステムの能力を高める。
論文 参考訳(メタデータ) (2024-08-07T08:43:32Z) - AIOS: LLM Agent Operating System [39.59087894012381]
本稿では,LLMベースのエージェント管理のコンテキスト下で,AIOS(LLMベースのAIエージェントオペレーティングシステム)のアーキテクチャを提案する。
エージェントアプリケーションからリソースとLLM固有のサービスをAIOSカーネルに分離することで、LLMベースのエージェントを提供するための新しいアーキテクチャを導入する。
AIOSを使用すると、さまざまなエージェントフレームワークで構築されたエージェントを最大2.1倍高速に実行することができる。
論文 参考訳(メタデータ) (2024-03-25T17:32:23Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z) - When Large Language Model Agents Meet 6G Networks: Perception,
Grounding, and Alignment [100.58938424441027]
モバイル端末とエッジサーバの協調を利用した6GネットワークにおけるAIエージェントの分割学習システムを提案する。
提案システムでは,LLMのための新しいモデルキャッシングアルゴリズムを導入し,コンテキストにおけるモデル利用を改善する。
論文 参考訳(メタデータ) (2024-01-15T15:20:59Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - Online Service Migration in Edge Computing with Incomplete Information:
A Deep Recurrent Actor-Critic Method [18.891775769665102]
マルチアクセスエッジコンピューティング(MEC)は、クラウドコンピューティングをネットワークエッジに拡張する新興コンピューティングパラダイムである。
サービス移行には,qos(quality-of-service)を維持するためのユーザサービスの移行場所を決定する必要がある
本稿では,ユーザ中心で効果的なオンライン移行決定が可能な,新たな学習駆動型手法である深層反復型アクタクリティックベースサービスマイグレーション(dracm)を提案する。
論文 参考訳(メタデータ) (2020-12-16T00:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。