論文の概要: Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
- arxiv url: http://arxiv.org/abs/2605.23929v1
- Date: Tue, 21 Apr 2026 23:09:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.476669
- Title: Toward Reliable Design of LLM-Enabled Agentic Workflows: Optimizing Latency-Reliability-Cost Tradeoffs
- Title(参考訳): LLM対応エージェントワークフローの信頼性設計に向けて:レイテンシ-信頼性-コストトレードオフの最適化
- Authors: Ya-Ting Yang, Quanyan Zhu,
- Abstract要約: 本稿では, LLM 対応エージェントにおけるレイテンシ, 信頼性, コストの基本的なトレードオフを解析する。
我々は,LLMエージェントと非LLMエージェントの両方のパフォーマンスモデルを導入し,計算労力と出力品質の関係を把握した。
主な成果としては、給水トークン割り当てポリシーと、シャドー価格の観点からの最適なワークフロー信頼性の評価がある。
- 参考スコア(独自算出の注目度): 22.661656301757663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern AI systems increasingly rely on workflows composed of multiple interacting agents, some powered by large language models (LLMs) and others by conventional computational modules. This paper analyzes the fundamental tradeoffs between latency, reliability, and cost in LLM-enabled agentic workflows. We introduce performance models for both LLM and non-LLM agents that capture the relationship between computational effort and output quality, incorporating the impact of reasoning and output tokens for LLM agents using a parametric exponential reliability function. Then, we study the design of sequential workflows under latency and cost constraints. Main results include a water-filling token allocation policy and characterizations of optimal workflow reliability in terms of shadow prices.
- Abstract(参考訳): 現代のAIシステムはますます、複数の対話エージェントで構成されたワークフローに依存しており、一部は大規模言語モデル(LLM)や、その他は従来の計算モジュールに依存している。
本稿では,LLM対応エージェントワークフローにおけるレイテンシ,信頼性,コストの基本的なトレードオフを解析する。
LLMエージェントと非LLMエージェントの両方のパフォーマンスモデルを導入し、パラメトリック指数信頼性関数を用いたLCMエージェントの推論と出力トークンの影響を取り入れた。
次に、レイテンシとコスト制約下でのシーケンシャルワークフローの設計について検討する。
主な成果としては、給水トークン割り当てポリシーと、シャドー価格の観点からの最適なワークフロー信頼性の評価がある。
関連論文リスト
- Optimizing Service Operations via LLM-Powered Multi-Agent Simulation [1.2997358113120427]
サービス操作を最適化するためのLLMを用いたマルチエージェントシミュレーションフレームワークを提案する。
我々は、決定に依存した不確実性を伴う最適化として問題を提起する。
本研究では,1つのシミュレーション実行時にゼロ階勾配推定を同時に構築し,定常状態性能を最適化するための設計パラメータを更新する軌道学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2026-04-06T03:14:33Z) - On Integrating Resilience and Human Oversight into LLM-Assisted Modeling Workflows for Digital Twins [0.0]
ディジタルツインにレジリエンスと監視を統合するための重要な設計原則を3つ提示する。
重要な貢献は、様々な詳細と複雑さのモデル記述にまたがるLCMによるエラーの詳細な評価である。
論文 参考訳(メタデータ) (2026-03-26T20:38:03Z) - Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs [62.17306142810532]
ヘテロジニアスLSMクラスタ上で動作するマルチエージェントワークフローの予測スケジューリングシステムであるChimeraを提案する。
Chimeは最高のレイテンシをトレースし、エンドツーエンドのレイテンシを1.2-2.4$times$で削減し、タスクパフォーマンスを平均8.0-9.5ポイント改善する。
論文 参考訳(メタデータ) (2026-03-23T17:01:42Z) - LLM for Large-Scale Optimization Model Auto-Formulation: A Lightweight Few-Shot Learning Approach [10.44190976207354]
LEAN-LLM-OPTは大規模なOPTimizationオートフォーミュレーションのためのワークフローフレームワークである。
モデリングタスクを構造化されたサブタスクに分解し、機械的なデータ処理操作を補助ツールにオフロードする。
大規模最適化モデリングタスクにおいて高い性能を達成し、最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2026-01-14T17:09:57Z) - Network and Systems Performance Characterization of MCP-Enabled LLM Agents [2.952262068394116]
Model Context Protocol(MCP)は、大規模な言語モデル(LLM)が外部ツールやサービスと対話するための標準化された方法を提供するため、AIコミュニティ内で最近注目を集めている。
本稿では,LCMを用いたMPP対応インタラクションの計測に基づく解析を行い,性能,性能,コストのトレードオフを明らかにした。
論文 参考訳(メタデータ) (2025-10-20T05:13:47Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - FactorLLM: Factorizing Knowledge via Mixture of Experts for Large Language Models [50.331708897857574]
本稿では,高度に訓練された高密度FFNを余分なサブネットワークに分解する新しいアプローチであるFacterLLMを紹介する。
FactorLLMは、最大85%のモデル性能を確保しながら、推論速度を30%以上増加させながら、ソースモデルに匹敵するパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-15T16:45:16Z) - AgentBench: Evaluating LLMs as Agents [99.12825098528212]
エージェントとしてのLarge Language Model (LLM)は近年広く認知されている。
我々は,LLM-as-Agentの推論と意思決定能力を評価するために,8つの異なる環境からなるベンチマークであるAgentBenchを提案する。
論文 参考訳(メタデータ) (2023-08-07T16:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。