論文の概要: Compiling Agentic Workflows into LLM Weights: Near-Frontier Quality at Two Orders of Magnitude Less Cost
- arxiv url: http://arxiv.org/abs/2605.22502v1
- Date: Thu, 21 May 2026 13:54:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.284818
- Title: Compiling Agentic Workflows into LLM Weights: Near-Frontier Quality at Two Orders of Magnitude Less Cost
- Title(参考訳): エージェントワークフローをLLMウェイトにコンパイルする:2桁のマグニチュードコストでニアフランティ品質
- Authors: Simon Dennis, Rivaan Patil, Kevin Shabahang, Hao Guo,
- Abstract要約: エージェントオーケストレーションフレームワークは、LangGraph、CrewAI、Google ADK、OpenAI Agents SDK、Semantic Kernel、Strands、LlamaIndexにまたがる合計で290,000以上のGitHubスターを誇っている。
- 参考スコア(独自算出の注目度): 1.6214121783846343
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agent orchestration frameworks have proliferated, collectively exceeding 290,000 GitHub stars across LangGraph, CrewAI, Google ADK, OpenAI Agents SDK, Semantic Kernel, Strands, and LlamaIndex. All follow the same pattern: an external orchestrator above the LLM, injecting instructions and routing decisions every turn. Recent work has shown this architecture is dominated for procedural tasks by simply providing the procedure in a frontier model's system prompt [Dennis et al., 2026a], at the cost of consuming the context window, requiring a frontier model for every conversation, and exposing proprietary procedures to third-party providers. Compiling the procedure into the weights of a small fine-tuned model -- creating a subterranean agent -- should resolve all of these concerns, and prior work (SimpleTOD, FireAct, SynTOD, WorkflowLLM, Agent Lumos) has shown the technique works. Yet developer adoption has overwhelmingly favored orchestration. We identify three perceived barriers and address each empirically across travel booking (14 nodes), Zoom support (14 nodes, product-specific knowledge), and insurance claims (55 nodes, 6 decision hubs).
- Abstract(参考訳): エージェントオーケストレーションフレームワークは、LangGraph、CrewAI、Google ADK、OpenAI Agents SDK、Semantic Kernel、Strands、LlamaIndexにまたがる合計で290,000以上のGitHubスターを誇っている。
すべてが同じパターンに従う: LLMの上の外部オーケストレータで、毎回命令とルーティングの決定を注入する。
近年の研究では,フロンティアモデルのシステムプロンプト [Dennis et al , 2026a] において,コンテキストウィンドウを消費し,会話毎にフロンティアモデルを必要とし,サードパーティプロバイダにプロプライエタリなプロシージャを公開することにより,プロシージャタスクにおいてこのアーキテクチャが支配的であることが示されている。
プロシージャを小さな微調整されたモデル(地下エージェントを作成する)の重みにコンパイルすると、これらの懸念を全て解決でき、以前の作業(SimpleTOD、FireAct、SynTOD、WorkflowLLM、Agent Lumos)がそのテクニックの動作を示している。
しかし、開発者の採用はオーケストレーションを圧倒的に好んでいる。
3つの障壁を識別し,旅行予約(14ノード),Zoomサポート(14ノード,製品固有の知識),保険請求(55ノード,6つの意思決定ハブ)を経験的に扱う。
関連論文リスト
- Code as Agent Harness [107.31925305395957]
新興のエージェントシステムでは、コードはもはや単なる目標出力ではない。
コードはエージェントの推論、行動、環境モデリング、実行ベースの検証のための運用上の基盤としてますます役立っている。
この調査は、実行可能、検証可能、ステートフルなAIエージェントシステムに向けた統一されたロードマップを提供する。
論文 参考訳(メタデータ) (2026-05-18T17:59:03Z) - Orchard: An Open-Source Agentic Modeling Framework [119.63254821764379]
スケーラブルなエージェントモデリングのためのオープンソースのフレームワークOrchardを紹介します。
Orchard Envは、サンドボックスライフサイクル管理のための再利用可能なプリミティブを提供する軽量環境サービスである。
Orchard Envの上に、3つのエージェントモデリングレシピを構築します。
論文 参考訳(メタデータ) (2026-05-14T16:35:12Z) - In-Context Prompting Obsoletes Agent Orchestration for Procedural Tasks [1.5113187239675951]
LangGraph、CrewAI、Google ADK、OpenAI Agents SDKなどのツールが、LCMの上に外部オーケストレータを配置し、状態を追跡し、各ターンにルーティング命令を注入する。
本稿では,手順全体をシステムプロンプトに配置し,モデルを自己組織化させるという,手続き的タスクにおいて,このアーキテクチャはより単純な選択肢によって支配されていることを示す。
論文 参考訳(メタデータ) (2026-04-30T14:07:37Z) - Interpretable Context Methodology: Folder Structure as Agentic Architecture [0.0]
AIエージェントオーケストレーションに対する現在のアプローチは、典型的には、コンテクストパッシング、メモリ、エラーハンドリング、コードによるステップ調整を管理するマルチエージェントフレームワークの構築を含む。
本稿では,フレームワークレベルのオーケストレーションを構造に置き換える手法である Model Workspace Protocol (MWP) を提案する。
平易なマークダウンファイルには、ひとつのAIエージェントに各ステップでどのような役割を果たすべきかを伝えるプロンプトとコンテキストがある。ローカルスクリプトは、AIをまったく必要としない機械的な作業を処理する。
論文 参考訳(メタデータ) (2026-03-17T00:03:23Z) - AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration [36.04766562662082]
AOrchestraはフレームワークに依存しないエージェント抽象化で、任意のエージェントをインストラクション、コンテキストツール、モデルとしてモデル化する。
タスク関連コンテキスト、ツール、モデルをキュレートし、オンザフライで自動エージェント生成を通じて実行を委譲する。
AOrchestraはGeminiと組んで最強のベースラインに対して16.28%の相対的な改善を達成した。
論文 参考訳(メタデータ) (2026-02-03T17:46:16Z) - PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback [52.763620660061115]
ONIは、RLポリシーと本質的な報酬関数を同時に学習する分散アーキテクチャである。
我々は、様々な複雑さを持つ報酬モデリングのためのアルゴリズムの選択範囲を探索する。
提案手法は,NetHack Learning Environment の様々な課題にまたがって,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-10-30T13:52:43Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。