論文の概要: Multi-Agent Automated Machine Learning
- arxiv url: http://arxiv.org/abs/2210.09084v1
- Date: Mon, 17 Oct 2022 13:32:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 17:33:25.435304
- Title: Multi-Agent Automated Machine Learning
- Title(参考訳): マルチエージェント自動機械学習
- Authors: Zhaozhi Wang, Kefan Su, Jian Zhang, Huizhu Jia, Qixiang Ye, Xiaodong
Xie, and Zongqing Lu
- Abstract要約: 自動機械学習(AutoML)におけるモジュールの共同最適化のためのマルチエージェント自動機械学習(MA2ML)を提案する。
MA2MLはモジュール間の協力を強化するために各エージェントにクレジットを明示的に割り当て、検索効率を向上させるために政治外の学習を取り入れている。
実験により、MA2MLは計算コストの制約の下でImageNet上で最先端のトップ1の精度が得られることが示された。
- 参考スコア(独自算出の注目度): 54.14038920246645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose multi-agent automated machine learning (MA2ML) with
the aim to effectively handle joint optimization of modules in automated
machine learning (AutoML). MA2ML takes each machine learning module, such as
data augmentation (AUG), neural architecture search (NAS), or hyper-parameters
(HPO), as an agent and the final performance as the reward, to formulate a
multi-agent reinforcement learning problem. MA2ML explicitly assigns credit to
each agent according to its marginal contribution to enhance cooperation among
modules, and incorporates off-policy learning to improve search efficiency.
Theoretically, MA2ML guarantees monotonic improvement of joint optimization.
Extensive experiments show that MA2ML yields the state-of-the-art top-1
accuracy on ImageNet under constraints of computational cost, e.g.,
$79.7\%/80.5\%$ with FLOPs fewer than 600M/800M. Extensive ablation studies
verify the benefits of credit assignment and off-policy learning of MA2ML.
- Abstract(参考訳): 本稿では,自動機械学習(AutoML)におけるモジュールの協調最適化を効果的に行うことを目的としたマルチエージェント自動機械学習(MA2ML)を提案する。
MA2MLは、データ拡張(AUG)、ニューラルアーキテクチャサーチ(NAS)、ハイパーパラメータ(HPO)などの各機械学習モジュールをエージェントとして、最終的なパフォーマンスを報酬として、マルチエージェント強化学習問題を定式化する。
MA2MLはモジュール間の協力を強化するために各エージェントにクレジットを明示的に割り当て、検索効率を向上させるために政治外の学習を取り入れている。
理論的には、MA2MLは関節最適化の単調な改善を保証する。
大規模な実験により、MA2MLは計算コストの制約の下でImageNetの最先端のトップ-1精度(例えば、FLOPが600M/800M未満の$79.7\%/80.5\%)を得ることが示された。
広範なアブレーション研究は、ma2mlの信用割当とオフポリシー学習の利点を検証する。
関連論文リスト
- Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization [65.64108848398696]
本稿では,MLLMのマルチモーダル推論能力を高めるための選好最適化プロセスを提案する。
我々は,マルチモーダルCoT性能を向上する,MPO(Mixed Preference Optimization)と呼ばれるシンプルで効果的な手法を開発した。
我々のモデルであるInternVL2-8B-MPOは、MathVista上で67.0の精度を実現し、InternVL2-8Bを8.7ポイント上回り、10倍のInternVL2-76Bに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2024-11-15T18:59:27Z) - SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning [14.702694298483445]
Tree-Search Enhanced LLM Agents (SELA)は、Monte Carlo Tree Search (MCTS)を利用してAutoMLプロセスを最適化するエージェントベースのシステムである。
SELAはパイプライン構成をツリーとして表現し、エージェントが知的かつ反復的に戦略を洗練させることを可能にする。
20の機械学習データセットにわたる広範囲な評価において、従来のAutoML手法とエージェントベースのAutoML手法のパフォーマンスを比較した。
論文 参考訳(メタデータ) (2024-10-22T17:56:08Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - Position: A Call to Action for a Human-Centered AutoML Paradigm [83.78883610871867]
自動機械学習(AutoML)は、機械学習(ML)を自動かつ効率的に構成する基本的目的を中心に形成された。
AutoMLの完全な可能性を解き放つ鍵は、現在探索されていないAutoMLシステムとのユーザインタラクションの側面に対処することにある、と私たちは主張する。
論文 参考訳(メタデータ) (2024-06-05T15:05:24Z) - AutoMMLab: Automatically Generating Deployable Models from Language
Instructions for Computer Vision Tasks [39.71649832548044]
AutoMMLabは、ユーザの言語命令に従う汎用LLMベースのAutoMLシステムである。
提案する AutoMMLab システムは,AutoML と OpenMMLab コミュニティを結ぶブリッジとして LLM を効果的に利用している。
実験の結果、AutoMMLabシステムは汎用的で、さまざまなメインストリームタスクをカバーしています。
論文 参考訳(メタデータ) (2024-02-23T14:38:19Z) - Multi-Microgrid Collaborative Optimization Scheduling Using an Improved
Multi-Agent Soft Actor-Critic Algorithm [8.461537684562776]
マルチマイクログリッド (MMG) システムは、異なる操作実体に属する複数の再生可能エネルギーマイクログリッドで構成されている。
本稿では,マルチエージェント集中型分散実行フレームワークに基づくMMG協調最適化モデルを提案する。
論文 参考訳(メタデータ) (2023-04-01T22:44:52Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - MALib: A Parallel Framework for Population-based Multi-agent
Reinforcement Learning [61.28547338576706]
人口ベースマルチエージェント強化学習(PB-MARL)は、強化学習(RL)アルゴリズムでネストした一連の手法を指す。
PB-MARLのためのスケーラブルで効率的な計算フレームワークMALibを提案する。
論文 参考訳(メタデータ) (2021-06-05T03:27:08Z) - MAMBPO: Sample-efficient multi-robot reinforcement learning using
learned world models [4.84279798426797]
マルチロボットシステムは、少数の試験で行動を学ぶ強化学習(RL)アルゴリズムの恩恵を受けることができます。
マルチエージェントモデルベースポリシー最適化(MAMBPO)という新しいマルチエージェントモデルベースRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-05T13:37:23Z) - Robusta: Robust AutoML for Feature Selection via Reinforcement Learning [24.24652530951966]
強化学習(RL)に基づく初の堅牢なAutoMLフレームワークRobostaを提案します。
このフレームワークは,良性サンプルの競争精度を維持しつつ,モデルロバスト性を最大22%向上させることができることを示す。
論文 参考訳(メタデータ) (2021-01-15T03:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。