論文の概要: Scaling Small Agents Through Strategy Auctions
- arxiv url: http://arxiv.org/abs/2602.02751v1
- Date: Mon, 02 Feb 2026 20:05:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.058506
- Title: Scaling Small Agents Through Strategy Auctions
- Title(参考訳): 戦略オークションによる小型エージェントのスケーリング
- Authors: Lisa Alazraki, William F. Shen, Yoram Bachrach, Akhil Mathur,
- Abstract要約: 我々は,小エージェントの性能が深層検索やコーディングタスクにおいて,タスクの複雑さを伴ってスケールしないことを示す。
フリーランサーマーケットプレースにインスパイアされたエージェントフレームワークである、ワークロード効率のためのStrategy Auctionsを紹介する。
SALEは最大のエージェントへの依存を53%減らし、全体のコストを35%減らし、最大のエージェントのpass@1を継続的に改善することを示した。
- 参考スコア(独自算出の注目度): 6.863341991827782
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Small language models are increasingly viewed as a promising, cost-effective approach to agentic AI, with proponents claiming they are sufficiently capable for agentic workflows. However, while smaller agents can closely match larger ones on simple tasks, it remains unclear how their performance scales with task complexity, when large models become necessary, and how to better leverage small agents for long-horizon workloads. In this work, we empirically show that small agents' performance fails to scale with task complexity on deep search and coding tasks, and we introduce Strategy Auctions for Workload Efficiency (SALE), an agent framework inspired by freelancer marketplaces. In SALE, agents bid with short strategic plans, which are scored by a systematic cost-value mechanism and refined via a shared auction memory, enabling per-task routing and continual self-improvement without training a separate router or running all models to completion. Across deep search and coding tasks of varying complexity, SALE reduces reliance on the largest agent by 53%, lowers overall cost by 35%, and consistently improves upon the largest agent's pass@1 with only a negligible overhead beyond executing the final trace. In contrast, established routers that rely on task descriptions either underperform the largest agent or fail to reduce cost -- often both -- underscoring their poor fit for agentic workflows. These results suggest that while small agents may be insufficient for complex workloads, they can be effectively "scaled up" through coordinated task allocation and test-time self-improvement. More broadly, they motivate a systems-level view of agentic AI in which performance gains come less from ever-larger individual models and more from market-inspired coordination mechanisms that organize heterogeneous agents into efficient, adaptive ecosystems.
- Abstract(参考訳): 小型言語モデルはエージェントAIに対する有望で費用対効果の高いアプローチとして、エージェントワークフローに十分な能力があると主張する支持者が増えている。
しかし、小さなエージェントは単純なタスクで大きなエージェントと密にマッチするが、そのパフォーマンスがタスクの複雑さとどのようにスケールするか、大規模なモデルが必要になったとき、そして長期のワークロードにどのように小さなエージェントをうまく活用するかは、まだ不明である。
本研究では,小エージェントのパフォーマンスが深層検索やコーディングタスクにおけるタスクの複雑さによってスケールできないことを実証的に示し,フリーランサーのマーケットプレースにインスパイアされたエージェントフレームワークであるStrategy Auctions for Workload efficiency (SALE)を紹介した。
SALEでは、エージェントは短い戦略的な計画で入札を行い、それは体系的なコスト値のメカニズムで決められ、共有オークションメモリを介して洗練され、個別のルータを訓練したり、全てのモデルを完了させることなく、タスクごとのルーティングと継続的な自己改善を可能にする。
さまざまな複雑さの深い検索とコーディングのタスクの中で、SALEは最大のエージェントへの依存を53%減らし、全体的なコストを35%減らし、最大のエージェントのpass@1を継続的に改善する。
対照的に、タスク記述に依存している確立されたルータは、最大のエージェントを過小評価するか、コスト削減に失敗する。
これらの結果は、小さなエージェントは複雑なワークロードでは不十分であるが、コーディネートされたタスクアロケーションとテスト時の自己改善によって、効果的に"スケールアップ"することができることを示唆している。
より広い意味では、彼らはエージェントAIのシステムレベルの視点を動機付けており、パフォーマンスの向上はより大きく個々のモデルから、さらに、異種エージェントを効率よく適応的なエコシステムに組織する市場インスパイアされた調整メカニズムから生まれる。
関連論文リスト
- AgentEvolver: Towards Efficient Self-Evolving Agent System [51.54882384204726]
本稿では,自律型エージェント学習を駆動する自己進化型エージェントシステムであるAgentEvolverを紹介する。
AgentEvolverは、セルフクエスト、セルフナビゲート、セルフコントリビューションという3つのシナジスティックメカニズムを導入している。
予備実験により、AgentEvolverは従来のRLベースのベースラインと比較して、より効率的な探索、より優れたサンプル利用、より高速な適応を実現していることが示された。
論文 参考訳(メタデータ) (2025-11-13T15:14:47Z) - Optimal-Agent-Selection: State-Aware Routing Framework for Efficient Multi-Agent Collaboration [20.982210711890513]
STRMACは、マルチエージェントシステムにおける効率的な協調のために設計された状態認識ルーティングフレームワークである。
提案手法は,ルータを駆動するためのインタラクション履歴とエージェント知識を符号化し,各ステップで最適な単一エージェントを適応的に選択する。
論文 参考訳(メタデータ) (2025-11-04T02:41:14Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - Efficient Agents: Building Effective Agents While Reducing Cost [48.65558640786415]
LLM(Large Language Model)によるエージェントは、複雑なマルチステップタスクに対処するための高度なシステムを実現する。
この研究は、現代のエージェントシステムにおける効率効率性トレードオフに関する最初の体系的研究である。
論文 参考訳(メタデータ) (2025-07-24T17:56:51Z) - Efficient LLM Collaboration via Planning [56.081879390960204]
小規模で大規模なモデルでは、プランナーと実行担当者として交代で行動し、タスクを協調的に解決するために、多段階のカスケードでプランを交換する。
私たちはCOPEが大規模プロプライエタリモデルに匹敵するパフォーマンスを実現し,推論APIのコストを大幅に削減できることを実証した。
論文 参考訳(メタデータ) (2025-06-13T08:35:50Z) - The Real Barrier to LLM Agent Usability is Agentic ROI [110.31127571114635]
大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。
我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
論文 参考訳(メタデータ) (2025-05-23T11:40:58Z) - Affordable AI Assistants with Knowledge Graph of Thoughts [16.990834791229044]
大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。
我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。
KGoTはGAIAベンチマークでのタスク成功率を、GPT-4o miniのHugging Face Agentsと比較して29%改善した。
論文 参考訳(メタデータ) (2025-04-03T15:11:55Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。
本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。
大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - Scalable Multi-Agent Inverse Reinforcement Learning via
Actor-Attention-Critic [54.2180984002807]
マルチエージェント逆逆強化学習 (MA-AIRL) は, 単エージェントAIRLをマルチエージェント問題に適用する最近の手法である。
本稿では,従来の手法よりもサンプル効率が高く,スケーラブルなマルチエージェント逆RLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-24T20:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。