論文の概要: Benchmarking AutoML algorithms on a collection of binary problems
- arxiv url: http://arxiv.org/abs/2212.02704v1
- Date: Tue, 6 Dec 2022 01:53:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 17:26:43.995107
- Title: Benchmarking AutoML algorithms on a collection of binary problems
- Title(参考訳): バイナリ問題の集合に対するautomlアルゴリズムのベンチマーク
- Authors: Pedro Henrique Ribeiro, Patryk Orzechowski, Joost Wagenaar, and Jason
H. Moore
- Abstract要約: 本稿では,Tree-based Pipeline Optimization Tool (TPOT), Auto-Sklearn, Auto-Sklearn 2, H2O AutoMLの4種類のAutoMLアルゴリズムの性能を比較した。
私たちはAutoMLがすべての含まれたデータセットでうまく機能するパイプラインを識別できることを確認します。
- 参考スコア(独自算出の注目度): 3.3793659640122717
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated machine learning (AutoML) algorithms have grown in popularity due
to their high performance and flexibility to adapt to different problems and
data sets. With the increasing number of AutoML algorithms, deciding which
would best suit a given problem becomes increasingly more work. Therefore, it
is essential to use complex and challenging benchmarks which would be able to
differentiate the AutoML algorithms from each other. This paper compares the
performance of four different AutoML algorithms: Tree-based Pipeline
Optimization Tool (TPOT), Auto-Sklearn, Auto-Sklearn 2, and H2O AutoML. We use
the Diverse and Generative ML benchmark (DIGEN), a diverse set of synthetic
datasets derived from generative functions designed to highlight the strengths
and weaknesses of the performance of common machine learning algorithms. We
confirm that AutoML can identify pipelines that perform well on all included
datasets. Most AutoML algorithms performed similarly without much room for
improvement; however, some were more consistent than others at finding
high-performing solutions for some datasets.
- Abstract(参考訳): 機械学習(AutoML)アルゴリズムは、さまざまな問題やデータセットに適応する高いパフォーマンスと柔軟性のために人気が高まっている。
AutoMLアルゴリズムの数が増加するにつれて、どの問題に最も適するかを判断する作業が増加します。
したがって、AutoMLアルゴリズムを互いに区別できるような、複雑で困難なベンチマークを使用することが不可欠である。
本稿では,Tree-based Pipeline Optimization Tool (TPOT), Auto-Sklearn, Auto-Sklearn 2, H2O AutoMLの4種類のAutoMLアルゴリズムの性能を比較した。
汎用機械学習アルゴリズムの性能の長所と短所を強調するために設計された生成関数から派生した多種多様な合成データセットであるdigen(diversative and generative ml benchmark)を使用する。
automlは、すべてのデータセットでうまく機能するパイプラインを識別できることを確認しました。
ほとんどのAutoMLアルゴリズムは改善の余地がほとんどないが、一部のデータセットに対して高いパフォーマンスのソリューションを見つける場合、他のアルゴリズムよりも一貫性が高かった。
関連論文リスト
- Automated Machine Learning for Multi-Label Classification [3.2634122554914002]
2つのアルゴリズムからなるシングルラベル分類タスクに対して,新しいAutoMLアプローチを考案する。
マルチラベル分類におけるAutoMLの課題複雑性を増大させるとともに,シングルラベル分類タスクにおける技術状態を形成するAutoMLアプローチがいかにスケールするかを検討する。
論文 参考訳(メタデータ) (2024-02-28T09:40:36Z) - AUTOACT: Automatic Agent Learning from Scratch via Self-Planning [56.81725335882185]
AutoActは、大規模アノテートデータやクローズドソースモデルからの合成軌跡に依存しない自動エージェント学習フレームワークである。
我々は異なるLLMを用いて総合的な実験を行い、AutoActは様々な強力なベースラインと比較して優れた性能または並列性能が得られることを示した。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - A Meta-Level Learning Algorithm for Sequential Hyper-Parameter Space
Reduction in AutoML [2.06188179769701]
本稿では,AutoMLツールの予測性能を損なうことなく,AutoMLツールのスペースを削減するアルゴリズムを提案する。
SHSRは284の分類と375の回帰問題に基づいて評価され、約30%の実行時間を短縮し、性能低下は0.1%未満であった。
論文 参考訳(メタデータ) (2023-12-11T11:26:43Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - Naive Automated Machine Learning -- A Late Baseline for AutoML [0.0]
AutoML(Automated Machine Learning)は、特定のデータセット上で最高の一般化パフォーマンスを持つパイプラインを自動的に見つける問題です。
機械学習の問題に関する重要なメタ知識を利用するAutoMLの非常に単純なソリューションであるNaive AutoMLを紹介します。
論文 参考訳(メタデータ) (2021-03-18T19:52:12Z) - PyGlove: Symbolic Programming for Automated Machine Learning [88.15565138144042]
シンボリックプログラミングに基づくAutoMLの新しいプログラミング方法を紹介します。
このパラダイムでは、MLプログラムは変更可能であるため、他のプログラムで簡単に操作できます。
PyGloveユーザーは、静的プログラムを検索空間に簡単に変換し、検索空間と検索アルゴリズムをすばやく繰り返し、複雑な検索フローを作成できることを示しています。
論文 参考訳(メタデータ) (2021-01-21T19:05:44Z) - An Extensive Experimental Evaluation of Automated Machine Learning
Methods for Recommending Classification Algorithms (Extended Version) [4.400989370979334]
これら3つの手法は進化的アルゴリズム(EA)に基づいており、もう1つはAuto-WEKAである。
我々は,これらの4つのAutoMLメソッドに,この制限の異なる値に対して,同じランタイム制限を付与する制御実験を行った。
一般に,3つの最良のAutoML手法の予測精度の差は統計的に有意ではなかった。
論文 参考訳(メタデータ) (2020-09-16T02:36:43Z) - Auto-Sklearn 2.0: Hands-free AutoML via Meta-Learning [45.643809726832764]
第2回ChaLearn AutoMLチャレンジへの勝利を動機とした新しいAutoMLアプローチを紹介します。
我々はPoSH Auto-Sklearnを開発した。これは、厳格な時間制限下で、AutoMLシステムが大きなデータセットでうまく機能することを可能にする。
また、真にハンズフリーなAutoMLに対する解決策を提案する。
論文 参考訳(メタデータ) (2020-07-08T12:41:03Z) - Auto-PyTorch Tabular: Multi-Fidelity MetaLearning for Efficient and
Robust AutoDL [53.40030379661183]
Auto-PyTorchは、完全に自動化されたディープラーニング(AutoDL)を実現するフレームワーク
ディープニューラルネットワーク(DNN)のウォームスタートとアンサンブルのためのマルチフィデリティ最適化とポートフォリオ構築を組み合わせる。
Auto-PyTorchは、いくつかの最先端の競合製品よりもパフォーマンスが良いことを示す。
論文 参考訳(メタデータ) (2020-06-24T15:15:17Z) - Is deep learning necessary for simple classification tasks? [3.3793659640122717]
自動機械学習(Automated Machine Learning、ML)とディープラーニング(Deep Learning、DL)は、帰納的学習タスクを解決するために使用される最先端のパラダイムである。
6つのよく認識された公開データセットのバイナリ分類の文脈でAutoMLとDLを比較した。
また、深部推定器を組み込んだ遺伝的プログラミングに基づくAutoMLの新しいツールの評価を行った。
論文 参考訳(メタデータ) (2020-06-11T18:41:47Z) - AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data [120.2298620652828]
オープンソースのAutoMLフレームワークであるAutoGluon-Tabularを紹介します。
KaggleとOpenML AutoML Benchmarkの50の分類および回帰タスクからなるスイートのテストによると、AutoGluonはより速く、より堅牢で、はるかに正確である。
論文 参考訳(メタデータ) (2020-03-13T23:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。