論文の概要: Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection
- arxiv url: http://arxiv.org/abs/2510.16499v1
- Date: Sat, 18 Oct 2025 13:37:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.016004
- Title: Automated Composition of Agents: A Knapsack Approach for Agentic Component Selection
- Title(参考訳): エージェントの自動組成: エージェント成分選択のためのKnapsackアプローチ
- Authors: Michelle Yuan, Khushbu Pahwa, Shuaichen Chang, Mustafa Kaba, Jiarong Jiang, Xiaofei Ma, Yi Zhang, Monica Sunkara,
- Abstract要約: 我々は,knapsack問題に触発されたエージェントシステム構成のための構造化された自動フレームワークを提案する。
本手法は,エージェントシステムの構築を効率化し,資源のスケーラブルな再利用を容易にする。
- 参考スコア(独自算出の注目度): 13.071959527010245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing effective agentic systems requires the seamless composition and integration of agents, tools, and models within dynamic and uncertain environments. Most existing methods rely on static, semantic retrieval approaches for tool or agent discovery. However, effective reuse and composition of existing components remain challenging due to incomplete capability descriptions and the limitations of retrieval methods. Component selection suffers because the decisions are not based on capability, cost, and real-time utility. To address these challenges, we introduce a structured, automated framework for agentic system composition that is inspired by the knapsack problem. Our framework enables a composer agent to systematically identify, select, and assemble an optimal set of agentic components by jointly considering performance, budget constraints, and compatibility. By dynamically testing candidate components and modeling their utility in real-time, our approach streamlines the assembly of agentic systems and facilitates scalable reuse of resources. Empirical evaluation with Claude 3.5 Sonnet across five benchmarking datasets shows that our online-knapsack-based composer consistently lies on the Pareto frontier, achieving higher success rates at significantly lower component costs compared to our baselines. In the single-agent setup, the online knapsack composer shows a success rate improvement of up to 31.6% in comparison to the retrieval baselines. In multi-agent systems, the online knapsack composer increases success rate from 37% to 87% when agents are selected from an agent inventory of 100+ agents. The substantial performance gap confirms the robust adaptability of our method across diverse domains and budget constraints.
- Abstract(参考訳): 効果的なエージェントシステムを設計するには、動的で不確実な環境でエージェント、ツール、モデルのシームレスな構成と統合が必要である。
既存の手法の多くは、ツールやエージェント発見のための静的なセマンティック検索アプローチに依存している。
しかし,不完全な機能記述や検索手法の限界のため,既存のコンポーネントの効果的な再利用と構成は依然として困難である。
コンポーネントの選択は、決定が能力、コスト、そしてリアルタイムのユーティリティに基づいていないため、苦しむ。
これらの課題に対処するために、knapsack問題に触発されたエージェントシステム構成のための構造化された自動フレームワークを導入する。
本フレームワークにより,演奏者エージェントは,性能,予算制約,互換性を共同で考慮し,最適なエージェントコンポーネントの集合を体系的に識別し,選択し,組み立てることができる。
候補コンポーネントを動的にテストし,それらのユーティリティをリアルタイムでモデル化することにより,エージェントシステムの組み立てを効率化し,リソースのスケーラブルな再利用を容易にする。
Claude 3.5 Sonnetによる5つのベンチマークデータセットに対する実証的な評価は、我々のオンラインクナップサックベースの作曲家が一貫してParetoフロンティアにあることを示している。
シングルエージェントのセットアップでは、オンラインのknapsack作曲家は検索ベースラインと比較して31.6%の成功率の向上を示している。
マルチエージェントシステムでは、オンラインクナプサック作曲家は、100以上のエージェントのインベントリからエージェントを選択すると、成功率を37%から87%に向上させる。
実質的なパフォーマンスギャップは、さまざまなドメインと予算制約にまたがる我々の手法の堅牢な適応性を確認します。
関連論文リスト
- JoyAgent-JDGenie: Technical Report on the GAIA [27.025464023889853]
大規模言語モデルは、複雑な現実世界のタスクのための自律的なエージェントとして、ますます多くデプロイされている。
本稿では,計画および実行エージェントを批判モデル投票と統合する汎用エージェントアーキテクチャ,作業層,意味層,手続き層にまたがる階層型メモリシステム,検索,コード実行,マルチモーダル解析のための洗練されたツールスイートを提案する。
論文 参考訳(メタデータ) (2025-10-01T04:41:58Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - Neural Orchestration for Multi-Agent Systems: A Deep Learning Framework for Optimal Agent Selection in Multi-Domain Task Environments [0.4640835690336653]
マルチドメインタスク環境における最適なエージェント選択のためのニューラルネットワークフレームワークであるMetaOrchを提案する。
ファジィ評価モジュールは、完全性、妥当性、信頼度に沿ってエージェント応答をスコアし、オーケストレータを訓練するためのソフトインスペクタラベルを生成する。
異種剤を用いた模擬環境実験により, 提案手法が86.3%の選択精度を達成できた。
論文 参考訳(メタデータ) (2025-05-03T02:58:25Z) - Agent-as-a-Judge: Evaluate Agents with Agents [61.33974108405561]
本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文 参考訳(メタデータ) (2024-10-14T17:57:02Z) - Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents [44.34340798542]
大きな言語モデル(LLM)は、複雑な推論を必要とする自然言語タスクにおいて顕著な能力を示している。
静的データセットに対する従来の教師付き事前トレーニングは、自律的なエージェント機能を実現するには不十分である。
本稿では,モンテカルロ木探索(MCTS)を自己批判機構と組み合わせ,エージェント間相互作用を反復的に微調整するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-13T20:52:13Z) - Robust and Performance Incentivizing Algorithms for Multi-Armed Bandits with Strategic Agents [52.75161794035767]
性能インセンティブとロバストネスの2つの目的を同時に満たすバンディットアルゴリズムのクラスを導入する。
そこで本研究では,第2価格オークションのアイデアをアルゴリズムと組み合わせることで,プリンシパルが腕の性能特性に関する情報を持たないような設定が可能であることを示す。
論文 参考訳(メタデータ) (2023-12-13T06:54:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。