論文の概要: Learning to Configure Agentic AI Systems
- arxiv url: http://arxiv.org/abs/2602.11574v1
- Date: Thu, 12 Feb 2026 04:45:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.64412
- Title: Learning to Configure Agentic AI Systems
- Title(参考訳): エージェントAIシステム構築の学習
- Authors: Aditya Taparia, Som Sagar, Ransalu Senanayake,
- Abstract要約: ARCは強化学習を用いて軽量な階層ポリシーを学習し、エージェント構成を動的に調整する。
その結果、ARCは「一つのサイズが全てに適合する」設計の強力な代替品であることが示された。
- 参考スコア(独自算出の注目度): 7.401472911415149
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Configuring LLM-based agent systems involves choosing workflows, tools, token budgets, and prompts from a large combinatorial design space, and is typically handled today by fixed large templates or hand-tuned heuristics. This leads to brittle behavior and unnecessary compute, since the same cumbersome configuration is often applied to both easy and hard input queries. We formulate agent configuration as a query-wise decision problem and introduce ARC (Agentic Resource & Configuration learner), which learns a light-weight hierarchical policy using reinforcement learning to dynamically tailor these configurations. Across multiple benchmarks spanning reasoning and tool-augmented question answering, the learned policy consistently outperforms strong hand-designed and other baselines, achieving up to 25% higher task accuracy while also reducing token and runtime costs. These results demonstrate that learning per-query agent configurations is a powerful alternative to "one size fits all" designs.
- Abstract(参考訳): LLMベースのエージェントシステムを構成するには、ワークフロー、ツール、トークン予算、および大規模な組合せ設計空間からのプロンプトを選択する必要がある。
簡単な入力クエリとハード入力クエリの両方で、同じ面倒な設定がしばしば適用されるため、これは脆い振る舞いと不要な計算につながる。
エージェント構成をクエリワイドな決定問題として定式化してARC(Agentic Resource & Configuration Learner)を導入し,これらの構成を動的に調整するために強化学習を用いて軽量な階層ポリシーを学習する。
推論とツール拡張された質問応答にまたがる複数のベンチマークで、学習ポリシは、強い手書き設計やその他のベースラインを一貫して上回り、最大25%のタスク精度を達成すると同時に、トークンとランタイムコストの削減を実現している。
これらの結果は、クエリごとのエージェント構成の学習が、"ひとつのサイズがすべてに適合する"設計の強力な代替手段であることを示している。
関連論文リスト
- Designing Domain-Specific Agents via Hierarchical Task Abstraction Mechanism [61.01709143437043]
階層型タスク抽象化機構(HTAM)を中心とした新しいエージェント設計フレームワークを提案する。
具体的には、HTAMは、社会的役割のエミュレーションを超えて、代わりに、複数のエージェントシステムを、あるドメインの固有のタスク依存グラフを反映する論理階層に構造化する。
我々は、複雑な地理空間解析に適したマルチエージェントシステムであるEarthAgentとして、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2025-11-21T12:25:47Z) - JSPLIT: A Taxonomy-based Solution for Prompt Bloating in Model Context Protocol [1.2166472806042592]
本稿では,分類学,ツール選択アルゴリズム,LITを評価するためのデータセットについて述べる。
その結果,LITはエージェントが効果的に反応する能力を著しく損なうことなく,プロンプトサイズを著しく減少させることがわかった。
論文 参考訳(メタデータ) (2025-10-16T10:28:23Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。
既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。
ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文 参考訳(メタデータ) (2025-10-06T10:44:04Z) - Powering Job Search at Scale: LLM-Enhanced Query Understanding in Job Matching Systems [10.9341814749217]
LLM(Large Language Model)を利用した統合クエリ理解フレームワークを提案する。
提案手法は,ユーザクエリとプロファイル属性などのコンテキスト信号とを共同でモデル化し,構造化された解釈を生成する。
このフレームワークは、オンラインA/Bテストにおける関連品質を改善し、システムの複雑さを著しく低減する。
論文 参考訳(メタデータ) (2025-08-19T21:35:43Z) - Assemble Your Crew: Automatic Multi-agent Communication Topology Design via Autoregressive Graph Generation [91.17994756436259]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)は、多様な領域にわたる複雑な問題を扱うための強力なソリューションとして登場した。
既存のアプローチは、事前に定義されたエージェントセットとハードコードされた相互作用構造を持つテンプレートグラフ修正パラダイムに依存しているため、基本的に制限されている。
協調グラフをスクラッチから構築することで、このパラダイムを運用する新しい自己回帰モデルであるARG-Designerを提案する。
論文 参考訳(メタデータ) (2025-07-24T09:17:41Z) - Factored Agents: Decoupling In-Context Learning and Memorization for Robust Tool Use [4.437184840125514]
本稿ではエージェントAIにおける従来の単一エージェントシステムの限界を克服する新しいファクターエージェントアーキテクチャを提案する。
提案手法はエージェントを,(1)高レベルプランナーおよびインコンテキスト学習者として機能する大規模言語モデル,(2)ツールフォーマットと出力の記憶器として機能する小型言語モデルに分解する。
経験的評価により,本アーキテクチャは,テキスト内学習と静的記憶のトレードオフを解明しつつ,計画精度と誤り回復性を著しく向上することが示された。
論文 参考訳(メタデータ) (2025-03-29T01:27:11Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。