論文の概要: When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2605.30102v1
- Date: Thu, 28 May 2026 15:45:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.442624
- Title: When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems
- Title(参考訳): クラウドエージェントとデバイスエージェント:ハイブリッドマルチエージェントシステムからの教訓
- Authors: Corrado Rainone, Davide Belli, Bence Major, Arash Behboodi,
- Abstract要約: エージェントAI推論の設計空間は、クラウドにホストされたフロンティア大型言語モデル(LLM)と、デバイス上での推論が可能なコスト効率のよい小型言語モデル(SLM)の2つの極端にまたがっている。
本研究では,タスクの正確性,金銭的コスト,エッジエネルギー消費が密結合した複雑な設計空間について検討する。
SLM は LLM の支援の恩恵を効果的に受けられるが、最適アーキテクチャはタスク依存度が高く、フロンティアレベルの計算はより優れた性能に一貫して変換されない。
- 参考スコア(独自算出の注目度): 9.412484771928353
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The design space of agentic AI inference spans two extremes: frontier large language models (LLMs), typically hosted in the cloud and offering strong performance across a wide range of tasks at substantially high cost, and more cost-efficient small language models (SLMs), which are amenable to on-device inference. Hybrid multi-agent systems (MASs) combining on-device and cloud models offer a promising middle ground, but they also introduce a complex and poorly understood design space in which task accuracy, monetary cost, and edge energy consumption are tightly coupled; in the absence of general design principles, hybrid components, although not the most prevalent choice, are typically introduced through ad hoc decisions tailored to specific domains. In this work, we examine this design space more systematically. We adapt two representative MAS architectures to support hybrid inference and study how individual design choices shift the operating point along the Pareto frontier of power, cost, and performance. Our findings paint a nuanced picture of hybrid MAS design: while SLMs can effectively benefit from LLM assistance, the optimal architecture is highly task-dependent, and greater frontier-level compute does not consistently translate to better performance.
- Abstract(参考訳): エージェントAI推論の設計空間は2つの極端にまたがる: 一般的にクラウドにホストされるフロンティア大型言語モデル(LLM)。
オンデバイスとクラウドモデルを組み合わせたハイブリッドマルチエージェントシステム(MAS)は、有望な中間層を提供するが、タスクの正確性、金銭的コスト、エッジエネルギーの消費が密結合である複雑な設計空間も導入する。
本研究では,この設計空間をより体系的に検討する。
ハイブリッド推論をサポートするために2つの代表的MASアーキテクチャを適用し、Paretoフロンティアにおける電力、コスト、パフォーマンスの個々の設計選択がオペレーションポイントをどのようにシフトするかを研究する。
SLM は LLM 支援の恩恵を効果的に受けられるが、最適アーキテクチャはタスク依存度が高く、フロンティアレベルの計算では性能が向上しない。
関連論文リスト
- CAMO: A Conditional Neural Solver for the Multi-objective Multiple Traveling Salesman Problem [13.232337043603161]
多目的多目的トラベリングセールスマン問題(MOMTSP)に対する条件付きニューラルネットワークCAMOを提案する。
ターゲット、エージェント、選好ベクトルの様々な数にまたがって一般化し、パレートフロント(PF)に高品質な近似をもたらす。
実験により、CAMOは神経と慣性の両方に優れており、PFのより近い近似が達成されている。
論文 参考訳(メタデータ) (2026-03-19T15:59:45Z) - ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - Controlling Performance and Budget of a Centralized Multi-agent LLM System with Reinforcement Learning [53.57360296655208]
大規模言語モデル(LLM)は、ドメイン間で補完的な強みを示し、様々な推論コストが伴う。
既存のアプローチは分散化されたフレームワークに依存しており、入力毎に複数のLSMを呼び出すため、実質的で制御されていない推論コストが発生する。
我々は,LLMコントローラが,コスト効率とコスト制御が可能な方法で,専門家モデルのプールを選択的にコーディネートする,集中型マルチLLMフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-04T17:35:17Z) - Toward Super Agent System with Hybrid AI Routers [19.22599167969104]
スーパーエージェントは、要約、コーディング、研究など、多様なユーザニーズを満たすことができる。
本稿では,ハイブリッドAIルータを用いたスーパーエージェントシステムの設計について述べる。
マルチモダリティモデルとエッジハードウェアの進歩により、ほとんどの計算はローカルで処理でき、クラウドのコラボレーションは必要なだけである、と私たちは考えています。
論文 参考訳(メタデータ) (2025-04-11T00:54:56Z) - Faster, Cheaper, Better: Multi-Objective Hyperparameter Optimization for LLM and RAG Systems [8.438382004567961]
本稿では,LLMおよびRAGシステム全体に対するコスト,レイテンシ,安全性,アライメントの多目的パラメータ最適化のための最初のアプローチを提案する。
ベイジアン最適化法はベースライン法よりも有意に優れていた。
我々は,多目的RAGシステムを設計している実践者に対する重要な配慮で研究を締めくくっている。
論文 参考訳(メタデータ) (2025-02-25T20:52:06Z) - Generative AI Agents with Large Language Model for Satellite Networks via a Mixture of Experts Transmission [74.10928850232717]
本稿では、モデル定式化のための生成人工知能(AI)エージェントを開発し、送信戦略の設計に専門家(MoE)の混合を適用した。
具体的には,大規模言語モデル(LLM)を活用して対話型モデリングパラダイムを構築する。
定式化問題の解法として, MoE-proximal Policy Optimization (PPO) アプローチを提案する。
論文 参考訳(メタデータ) (2024-04-14T03:44:54Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。