論文の概要: ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering
- arxiv url: http://arxiv.org/abs/2511.03985v1
- Date: Thu, 06 Nov 2025 02:14:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.273867
- Title: ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering
- Title(参考訳): ArchPilot: マシンラーニングエンジニアリングのためのプロキシガイドによるマルチエージェントアプローチ
- Authors: Zhuowen Yuan, Tao Liu, Yang Yang, Yang Wang, Feng Qi, Kaushik Rangadurai, Bo Li, Shuang Yang,
- Abstract要約: ArchPilotは、アーキテクチャ生成、プロキシベースの評価、適応検索を統一されたフレームワークに統合するマルチエージェントシステムである。
コストのかかるフルトレーニングの実行に最小限依存した、強力な候補を優先し、限られた予算下で効率的なMLエンジニアリングを促進する。
- 参考スコア(独自算出の注目度): 18.83090180326138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent LLM-based agents have demonstrated strong capabilities in automated ML engineering. However, they heavily rely on repeated full training runs to evaluate candidate solutions, resulting in significant computational overhead, limited scalability to large search spaces, and slow iteration cycles. To address these challenges, we introduce ArchPilot, a multi-agent system that integrates architecture generation, proxy-based evaluation, and adaptive search into a unified framework. ArchPilot consists of three specialized agents: an orchestration agent that coordinates the search process using a Monte Carlo Tree Search (MCTS)-inspired novel algorithm with a restart mechanism and manages memory of previous candidates; a generation agent that iteratively generates, improves, and debugs candidate architectures; and an evaluation agent that executes proxy training runs, generates and optimizes proxy functions, and aggregates the proxy scores into a fidelity-aware performance metric. This multi-agent collaboration allows ArchPilot to prioritize high-potential candidates with minimal reliance on expensive full training runs, facilitating efficient ML engineering under limited budgets. Experiments on MLE-Bench demonstrate that ArchPilot outperforms SOTA baselines such as AIDE and ML-Master, validating the effectiveness of our multi-agent system.
- Abstract(参考訳): 最近のLSMベースのエージェントは、自動化MLエンジニアリングにおいて強力な機能を示している。
しかし、それらは候補ソリューションを評価するために繰り返しのフルトレーニングの実行に大きく依存しており、計算オーバーヘッドが大幅に増加し、大規模な検索スペースへのスケーラビリティが制限され、イテレーションサイクルが遅くなる。
これらの課題に対処するために、アーキテクチャ生成、プロキシベースの評価、適応検索を統合されたフレームワークに統合するマルチエージェントシステムであるArchPilotを紹介する。
ArchPilotは、Monte Carlo Tree Search(MCTS)にインスパイアされた新しいアルゴリズムと再起動機構を使用して検索プロセスをコーディネートし、以前の候補のメモリを管理するオーケストレーションエージェント、候補アーキテクチャを反復的に生成、改善、デバッグする生成エージェント、プロキシトレーニングの実行を実行し、プロキシ関数を生成し、最適化する評価エージェント、そしてプロキシスコアをフィデリティ対応のパフォーマンスメトリックに集約する。
このマルチエージェントコラボレーションにより、ArchPilotは、高価なフルトレーニング実行への最小限の依存で、強力な候補を優先順位付けし、限られた予算下で効率的なMLエンジニアリングを促進することができる。
MLE-Benchの実験では、ArchPilotはAIDEやML-MasterといったSOTAベースラインよりも優れており、マルチエージェントシステムの有効性が検証されている。
関連論文リスト
- AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。
既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。
ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文 参考訳(メタデータ) (2025-10-06T10:44:04Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.406849007798858]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science [70.1638335489284]
高レベルの機械学習エンジニアリングタスクは、労働集約的で反復的である。
機械学習プロセスを形式化する包括的で分離されたフレームワークであるR&D-Agentを紹介します。
R&D-AgentはMLEを2つのフェーズと6つのコンポーネントに定義し、MLEのエージェント設計を原則としてテスト可能なプロセスに変える。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。