論文の概要: VineLM: Trie-Based Fine-Grained Control for Agentic Workflows
- arxiv url: http://arxiv.org/abs/2605.23914v1
- Date: Thu, 09 Apr 2026 15:31:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.460135
- Title: VineLM: Trie-Based Fine-Grained Control for Agentic Workflows
- Title(参考訳): VineLM: エージェントワークフローのためのトライベースファイングラインドコントロール
- Authors: Nikos Pagonas, Matthew Lou, Tianyi Peng, Dan Rubenstein, Kostis Kaffes,
- Abstract要約: VineLMは、モデル選択プレフィックスの注釈付きトリエとして実行可能な実行を表す。
VineLMは、モデル選択プレフィックスの注釈付きトリエとして実行可能な実行を表す。
- 参考スコア(独自算出の注目度): 4.984467399543813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic workflows interleave configurable LLM stages with tool stages and often include retries or refinement loops. Existing workflow managers profile full workflow configurations offline and assign each request a static workflow-level plan that binds each configurable LLM stage to a single model, reuses that model across repeated loop iterations, and does not revisit those choices at runtime. We present VineLM, a workflow manager that enables fine-grained control by choosing the model for each stage invocation as execution unfolds under request-level objectives such as maximizing accuracy under cost or latency budgets. VineLM represents feasible executions as an annotated trie of model-choice prefixes and uses checkpointing and cascade profiling to estimate path accuracy, cost, and latency without exhaustively profiling every request on every path. At runtime, VineLM re-roots the trie after each stage invocation and replans over the remaining subtrie using the realized execution prefix and remaining latency budget. On NL2SQL and math reasoning workflows, VineLM improves the cost-latency-accuracy frontier over coarse workflow-level baselines, achieving up to 18% higher accuracy at the same per-request budget with its sparse profiling reducing offline profiling cost by 98-99.8% when compared to exhaustive profiling.
- Abstract(参考訳): エージェントワークフローは、設定可能なLCMステージとツールステージをインターリーブする。
既存のワークフローマネージャは、オフラインでワークフロー設定をプロファイルし、各リクエストに静的なワークフローレベルプランを割り当て、各構成可能なLCMステージをひとつのモデルにバインドし、繰り返しループを繰り返してモデルを再利用し、実行時にそれらの選択を再考しない。
我々は、コストやレイテンシの予算の下での精度の最大化といった要求レベルの目的の下で実行が展開されるにつれて、各ステージ呼び出しのモデルを選択することで、きめ細かい制御を可能にするワークフローマネージャであるVineLMを提案する。
VineLMは、モデル選択プレフィックスの注釈付きトリエとして実行可能な実行を表し、チェックポイントとカスケードプロファイリングを使用して、すべてのパスに対するすべての要求を徹底的にプロファイリングすることなく、パスの正確性、コスト、レイテンシを推定する。
実行時にVineLMは、各ステージの実行後にトリエを再ルートし、実行プレフィックスと待ち時間予算を使用して残りのサブストリーをリプランする。
NL2SQLと数学推論のワークフローでは、VineLMは、粗いワークフローレベルのベースラインよりもコスト-レイテンシ-精度のフロンティアを改善し、全体のプロファイリングに比べて、オフラインプロファイリングコストを98-99.8%削減するスパースプロファイリングにより、要求毎の予算で最大18%高い精度を達成する。
関連論文リスト
- On Time, Within Budget: Constraint-Driven Online Resource Allocation for Agentic Workflows [37.22092976146466]
エージェントシステムは、サブタスクを特別なモデルやツールに割り当て、依存関係に応じて調整するオーケストレーション実行ファイルを実行することで、複雑なユーザリクエストをますます解決します。
ワークフローは特定の予算内に完了し、特定の期限前に完了しなければならない。
これにより、平均的な効率最適化から、ワークフロー全体が明確な予算と期限の制約の下で正常に完了する確率の最大化へとゴールをシフトします。
論文 参考訳(メタデータ) (2026-05-07T12:24:21Z) - Why Search When You Can Transfer? Amortized Agentic Workflow Design from Structural Priors [51.95306551061392]
エージェントワークフローの自動設計は、現在、タスクごとの反復検索に依存している。
本稿では,ワークフロー設計を再利用可能な構造的先入観に補正するフレームワークであるSWIFTを提案する。
SWIFTは5つのベンチマークで最先端の検索手法より優れている。
論文 参考訳(メタデータ) (2026-04-27T21:25:00Z) - Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs [62.17306142810532]
ヘテロジニアスLSMクラスタ上で動作するマルチエージェントワークフローの予測スケジューリングシステムであるChimeraを提案する。
Chimeは最高のレイテンシをトレースし、エンドツーエンドのレイテンシを1.2-2.4$times$で削減し、タスクパフォーマンスを平均8.0-9.5ポイント改善する。
論文 参考訳(メタデータ) (2026-03-23T17:01:42Z) - Do We Always Need Query-Level Workflows? Rethinking Agentic Workflow Generation for Multi-Agent Systems [72.3575737073235]
マルチエージェントシステム(MAS)は、複数のエージェントを協調することで複雑なタスクを解決する。
既存のアプローチはタスクレベルかクエリレベルで生成されるが、その相対的なコストと利点は未だ不明である。
クエリレベルのワークフロー生成は必ずしも必要ではない、なぜなら、トップKレベルのタスクレベルの小さなセットが、すでに同等あるいはそれ以上のクエリをカバーしているからだ。
論文 参考訳(メタデータ) (2026-01-16T10:05:51Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。