論文の概要: A Multi-Agent Framework for Code-Guided, Modular, and Verifiable Automated Machine Learning
- arxiv url: http://arxiv.org/abs/2602.13937v1
- Date: Sun, 15 Feb 2026 00:20:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.569769
- Title: A Multi-Agent Framework for Code-Guided, Modular, and Verifiable Automated Machine Learning
- Title(参考訳): コードガイド型,モジュール型,検証可能な自動機械学習のためのマルチエージェントフレームワーク
- Authors: Dat Le, Duc-Cuong Le, Anh-Son Nguyen, Tuan-Dung Bui, Thu-Trang Nguyen, Son Nguyen, Hieu Dinh Vo,
- Abstract要約: iMLは、AutoMLをブラックボックスからコード誘導、モジュール化、検証可能なアーキテクチャパラダイムに移行するために設計された、新しいマルチエージェントフレームワークである。
MLE-BENCHと新たに導入されたiML-BENCHをまたいでiMLを評価する。
- 参考スコア(独自算出の注目度): 3.6317933453723232
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Automated Machine Learning (AutoML) has revolutionized the development of data-driven solutions; however, traditional frameworks often function as "black boxes", lacking the flexibility and transparency required for complex, real-world engineering tasks. Recent Large Language Model (LLM)-based agents have shifted toward code-driven approaches. However, they frequently suffer from hallucinated logic and logic entanglement, where monolithic code generation leads to unrecoverable runtime failures. In this paper, we present iML, a novel multi-agent framework designed to shift AutoML from black-box prompting to a code-guided, modular, and verifiable architectural paradigm. iML introduces three main ideas: (1) Code-Guided Planning, which synthesizes a strategic blueprint grounded in autonomous empirical profiling to eliminate hallucination; (2) Code-Modular Implementation, which decouples preprocessing and modeling into specialized components governed by strict interface contracts; and (3) Code-Verifiable Integration, which enforces physical feasibility through dynamic contract verification and iterative self-correction. We evaluate iML across MLE-BENCH and the newly introduced iML-BENCH, comprising a diverse range of real-world Kaggle competitions. The experimental results show iML's superiority over state-of-the-art agents, achieving a valid submission rate of 85% and a competitive medal rate of 45% on MLE-BENCH, with an average standardized performance score (APS) of 0.77. On iML-BENCH, iML significantly outperforms the other approaches by 38%-163% in APS. Furthermore, iML maintains a robust 70% success rate even under stripped task descriptions, effectively filling information gaps through empirical profiling. These results highlight iML's potential to bridge the gap between stochastic generation and reliable engineering, marking a meaningful step toward truly AutoML.
- Abstract(参考訳): 自動機械学習(Automated Machine Learning, AutoML)は、データ駆動型ソリューションの開発に革命をもたらしたが、複雑な現実世界のエンジニアリングタスクに必要な柔軟性と透明性を欠いた、従来のフレームワークは、しばしば"ブラックボックス"として機能する。
最近のLarge Language Model(LLM)ベースのエージェントは、コード駆動アプローチに移行している。
しかしながら、モノリシックなコード生成が回復不能なランタイム障害を引き起こすような、幻覚的なロジックとロジックの絡み合いに悩まされることが多い。
本稿では,AutoMLをブラックボックスからコード誘導型,モジュール型,検証可能なアーキテクチャパラダイムに移行するために設計された,新しいマルチエージェントフレームワークであるiMLを提案する。
iMLは,(1)幻覚をなくすための自律的経験的プロファイリングを基盤とした戦略的青写真を生成するコードガイドプランニング,(2)厳密なインターフェース契約によって管理される特殊なコンポーネントに事前処理とモデリングを分離するコードモジュール実装,(3)動的コントラクト検証と反復的自己補正による物理的実現性を実施するコード検証統合,の3つの考え方を紹介した。
MLE-BENCHと新たに導入されたiML-BENCHをまたいでiMLを評価する。
実験の結果、iMLは最先端のエージェントよりも優れており、MLE-BENCHでは有効な応募率85%と競技メダル率45%を達成し、平均標準性能スコア(APS)は0.77であることがわかった。
iML-BENCHでは、iMLは他のアプローチよりも38%~163%優れています。
さらに、iMLは、取り除かれたタスク記述でも70%の成功率を維持し、経験的プロファイリングによって情報ギャップを効果的に埋める。
これらの結果は、確率的生成と信頼性のあるエンジニアリングのギャップを埋めるiMLの可能性を強調しており、真にAutoMLに向けた重要なステップとなっている。
関連論文リスト
- A Lightweight Modular Framework for Constructing Autonomous Agents Driven by Large Language Models: Design, Implementation, and Applications in AgentForge [1.932555230783329]
LLM駆動の自律エージェントの構築を民主化するために設計された軽量でオープンソースのPythonフレームワーク。
AgentForgeは、(1)正式に定義された入出力契約できめ細かいタスク分解を可能にする構成可能なスキル抽象化、(2)クラウドベースのAPIとローカル推論エンジンのシームレスな切り替えをサポートする統一されたバックエンドインターフェース、(3)エージェントロジックと実装の詳細を分離する宣言型YAMLベースの構成システムである。
論文 参考訳(メタデータ) (2026-01-19T20:33:26Z) - MeltRTL: Multi-Expert LLMs with Inference-time Intervention for RTL Code Generation [0.0]
MeltRTLは、マルチエキスパートの注意と推論時間の介入を統合する新しいフレームワークである。
MeltRTLは、ベースモデルを再トレーニングすることなく、大きな言語モデル(LLM)の精度を大幅に改善する。
We evaluate MeltRTL on the VerilogEval benchmark, achieve 96% synthesizability and 60% functional correctness。
論文 参考訳(メタデータ) (2026-01-19T12:49:39Z) - An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。
AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。
AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-10-19T03:59:25Z) - Towards Adaptive ML Benchmarks: Web-Agent-Driven Construction, Domain Expansion, and Metric Optimization [8.356074728041202]
TAM Benchは、エンドツーエンドの機械学習タスクで大規模言語モデル(LLM)を評価するためのベンチマークである。
3つの重要なイノベーションは、ブラウザの自動化とLLMベースのタスク獲得システムである。
150のキュレートされたAutoMLタスクに基づいて、異なるサイズのベンチマークサブセットを3つ構築する。
論文 参考訳(メタデータ) (2025-09-11T10:10:48Z) - SimMLM: A Simple Framework for Multi-modal Learning with Missing Modality [52.948791050405525]
モーダルを欠くマルチモーダル学習のためのシンプルで強力なフレームワークであるSimMLMを提案する。
SimMLMは、動的で学習可能なゲーティング機構を備えたDMoME(Dynamic Mixture of Modality Experts)アーキテクチャで構成されている。
SimMLMの主な革新はMoFe(MoFe)ランキングの損失の増加であり、より多くのモダリティが利用可能になるにつれてタスクの精度が向上または安定し続けることを保証する。
論文 参考訳(メタデータ) (2025-07-25T13:39:34Z) - CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs [16.234259194402163]
マルチエージェント推論を符号化し、マルチエージェントシステムにおける構造化されたトークン効率の計画を可能にするプロンプトフレームワークであるCodeAgentsを紹介する。
その結果, 計画性能は一貫した改善がみられ, 基本となる自然言語よりも3~36ポイントの絶対的な向上が見られた。
論文 参考訳(メタデータ) (2025-07-04T02:20:19Z) - MLZero: A Multi-Agent System for End-to-end Machine Learning Automation [48.716299953336346]
MLZeroはLarge Language Models(LLM)を利用した新しいマルチエージェントフレームワークである。
認知認識モジュールが最初に使用され、生のマルチモーダル入力を知覚コンテキストに変換する。
MLZeroは、MLE-Bench Liteで優れたパフォーマンスを示し、成功率とソリューション品質の両方で競合他社を上回っている。
論文 参考訳(メタデータ) (2025-05-20T05:20:53Z) - LLaVA-KD: A Framework of Distilling Multimodal Large Language Models [72.68665884790002]
本稿では,l-MLLMからs-MLLMへ知識を伝達する新しいフレームワークを提案する。
本稿では,教師モデルの頑健な表現を視覚的,言語的両面で伝達するために,MDist(Multimodal Distillation)を導入する。
また,提案した蒸留戦略の可能性をフル活用するための3段階学習手法を提案する。
論文 参考訳(メタデータ) (2024-10-21T17:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。