論文の概要: AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data
- arxiv url: http://arxiv.org/abs/2003.06505v1
- Date: Fri, 13 Mar 2020 23:10:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 01:13:22.713048
- Title: AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data
- Title(参考訳): AutoGluon-Tabular:構造化データのためのロバストで正確なAutoML
- Authors: Nick Erickson, Jonas Mueller, Alexander Shirkov, Hang Zhang, Pedro
Larroy, Mu Li, Alexander Smola
- Abstract要約: オープンソースのAutoMLフレームワークであるAutoGluon-Tabularを紹介します。
KaggleとOpenML AutoML Benchmarkの50の分類および回帰タスクからなるスイートのテストによると、AutoGluonはより速く、より堅牢で、はるかに正確である。
- 参考スコア(独自算出の注目度): 120.2298620652828
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce AutoGluon-Tabular, an open-source AutoML framework that requires
only a single line of Python to train highly accurate machine learning models
on an unprocessed tabular dataset such as a CSV file. Unlike existing AutoML
frameworks that primarily focus on model/hyperparameter selection,
AutoGluon-Tabular succeeds by ensembling multiple models and stacking them in
multiple layers. Experiments reveal that our multi-layer combination of many
models offers better use of allocated training time than seeking out the best.
A second contribution is an extensive evaluation of public and commercial
AutoML platforms including TPOT, H2O, AutoWEKA, auto-sklearn, AutoGluon, and
Google AutoML Tables. Tests on a suite of 50 classification and regression
tasks from Kaggle and the OpenML AutoML Benchmark reveal that AutoGluon is
faster, more robust, and much more accurate. We find that AutoGluon often even
outperforms the best-in-hindsight combination of all of its competitors. In two
popular Kaggle competitions, AutoGluon beat 99% of the participating data
scientists after merely 4h of training on the raw data.
- Abstract(参考訳): これはオープンソースのautomlフレームワークで、csvファイルのような未処理の表型データセット上で高精度な機械学習モデルをトレーニングするために、pythonを1行だけ必要とします。
モデル/ハイパーパラメータ選択に重点を置く既存のAutoMLフレームワークとは異なり、AutoGluon-Tabularは複数のモデルをまとめて複数のレイヤに積み重ねることで成功している。
実験により、多くのモデルの多層結合は、ベストを追求するよりも、割り当てられたトレーニング時間をうまく活用できることがわかった。
第2のコントリビューションは、TPOT、H2O、AutoWEKA、Auto-sklearn、AutoGluon、Google AutoML Tablesなど、パブリックおよび商用AutoMLプラットフォームの広範な評価である。
KaggleとOpenML AutoML Benchmarkの50の分類および回帰タスクからなるスイートのテストによると、AutoGluonはより速く、より堅牢で、はるかに正確である。
AutoGluonは、競合他社の最も目に見える組み合わせよりも優れています。
2つの有名なKaggleコンペティションでは、AutoGluonが生データに関するトレーニングをわずか4時間で行った後、参加データサイエンティストの99%を破った。
関連論文リスト
- Squeezing Lemons with Hammers: An Evaluation of AutoML and Tabular Deep Learning for Data-Scarce Classification Applications [2.663744975320783]
L2正規化ロジスティック回帰は、最先端の自動機械学習(AutoML)フレームワークと同様の性能を発揮する。
データスカースアプリケーションの第1選択として、ロジスティック回帰を考慮することをお勧めします。
論文 参考訳(メタデータ) (2024-05-13T11:43:38Z) - AutoGluon-Multimodal (AutoMM): Supercharging Multimodal AutoML with Foundation Models [31.816755598468077]
AutoMMは、わずか3行のコードで基礎モデルの微調整を可能にする。
AutoMMは、分類、回帰、オブジェクト検出、セマンティックマッチング、イメージセグメンテーションにまたがる、包括的な機能スイートを提供する。
論文 参考訳(メタデータ) (2024-04-24T22:28:12Z) - AutoGluon-TimeSeries: AutoML for Probabilistic Time Series Forecasting [80.14147131520556]
AutoGluon-TimeSeriesは、確率的時系列予測のためのオープンソースのAutoMLライブラリである。
3行のPythonコードで正確なポイントと量子予測を生成する。
論文 参考訳(メタデータ) (2023-08-10T13:28:59Z) - Benchmarking Multimodal AutoML for Tabular Data with Text Fields [83.43249184357053]
テキストフィールドを含む18個のマルチモーダルデータテーブルを組み立てる。
このベンチマークにより、研究者は、数値的、分類的、テキスト的特徴を用いて教師あり学習を行うための独自の方法を評価することができる。
論文 参考訳(メタデータ) (2021-11-04T09:29:16Z) - Can AutoML outperform humans? An evaluation on popular OpenML datasets
using AutoML Benchmark [0.05156484100374058]
この記事では、OpenMLから12の人気のあるデータセット上の4つのAutoMLフレームワークを比較します。
その結果、自動化されたフレームワークは、12のOpenMLタスクのうち7つの機械学習コミュニティより優れているか等しいかが分かる。
論文 参考訳(メタデータ) (2020-09-03T10:25:34Z) - Auto-Sklearn 2.0: Hands-free AutoML via Meta-Learning [45.643809726832764]
第2回ChaLearn AutoMLチャレンジへの勝利を動機とした新しいAutoMLアプローチを紹介します。
我々はPoSH Auto-Sklearnを開発した。これは、厳格な時間制限下で、AutoMLシステムが大きなデータセットでうまく機能することを可能にする。
また、真にハンズフリーなAutoMLに対する解決策を提案する。
論文 参考訳(メタデータ) (2020-07-08T12:41:03Z) - AutoRec: An Automated Recommender System [44.11798716678736]
エコシステムから拡張された、オープンソースの自動機械学習(AutoML)プラットフォームであるAutoRecを紹介します。
AutoRecはスパースとディープインプットの両方に対応可能な、非常にフレキシブルなパイプラインをサポートする。
ベンチマークデータセットで実施された実験によると、AutoRecは信頼性が高く、事前の知識なしに最高のモデルに似たモデルを特定することができる。
論文 参考訳(メタデータ) (2020-06-26T17:04:53Z) - Fast, Accurate, and Simple Models for Tabular Data via Augmented
Distillation [97.42894942391575]
本研究では、FAST-DADを用いて、任意の複雑なアンサンブル予測を、高木、無作為林、深層ネットワークなどの個々のモデルに抽出する。
我々の個々の蒸留モデルは、H2O/AutoSklearnのようなAutoMLツールが生成するアンサンブル予測よりも10倍高速で精度が高い。
論文 参考訳(メタデータ) (2020-06-25T09:57:47Z) - Auto-PyTorch Tabular: Multi-Fidelity MetaLearning for Efficient and
Robust AutoDL [53.40030379661183]
Auto-PyTorchは、完全に自動化されたディープラーニング(AutoDL)を実現するフレームワーク
ディープニューラルネットワーク(DNN)のウォームスタートとアンサンブルのためのマルチフィデリティ最適化とポートフォリオ構築を組み合わせる。
Auto-PyTorchは、いくつかの最先端の競合製品よりもパフォーマンスが良いことを示す。
論文 参考訳(メタデータ) (2020-06-24T15:15:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。