論文の概要: Amazon SageMaker Autopilot: a white box AutoML solution at scale
- arxiv url: http://arxiv.org/abs/2012.08483v2
- Date: Wed, 16 Dec 2020 18:51:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 05:16:30.331592
- Title: Amazon SageMaker Autopilot: a white box AutoML solution at scale
- Title(参考訳): Amazon SageMaker Autopilot: 大規模にホワイトボックスのAutoMLソリューション
- Authors: Piali Das, Valerio Perrone, Nikita Ivkin, Tanya Bansal, Zohar Karnin,
Huibin Shen, Iaroslav Shcherbatyi, Yotam Elor, Wilton Wu, Aida Zolic, Thibaut
Lienart, Alex Tang, Amr Ahmed, Jean Baptiste Faddoul, Rodolphe Jenatton, Fela
Winkelmolen, Philip Gautier, Leo Dirac, Andre Perunicic, Miroslav
Miladinovic, Giovanni Zappella, C\'edric Archambeau, Matthias Seeger, Bhaskar
Dutt, Laurence Rouesnel
- Abstract要約: 自動機械学習ソリューションを提供するフルマネージドシステムであるAmazon SageMaker Autopilotを紹介します。
Autopilotは問題タイプを特定し、データを解析し、さまざまな完全なMLパイプラインを生成する。
パフォーマンスが不十分なシナリオでは、データサイエンティストが提案されたMLパイプラインを閲覧し、編集することができる。
- 参考スコア(独自算出の注目度): 16.607423930188734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AutoML systems provide a black-box solution to machine learning problems by
selecting the right way of processing features, choosing an algorithm and
tuning the hyperparameters of the entire pipeline. Although these systems
perform well on many datasets, there is still a non-negligible number of
datasets for which the one-shot solution produced by each particular system
would provide sub-par performance. In this paper, we present Amazon SageMaker
Autopilot: a fully managed system providing an automated ML solution that can
be modified when needed. Given a tabular dataset and the target column name,
Autopilot identifies the problem type, analyzes the data and produces a diverse
set of complete ML pipelines including feature preprocessing and ML algorithms,
which are tuned to generate a leaderboard of candidate models. In the scenario
where the performance is not satisfactory, a data scientist is able to view and
edit the proposed ML pipelines in order to infuse their expertise and business
knowledge without having to revert to a fully manual solution. This paper
describes the different components of Autopilot, emphasizing the infrastructure
choices that allow scalability, high quality models, editable ML pipelines,
consumption of artifacts of offline meta-learning, and a convenient integration
with the entire SageMaker suite allowing these trained models to be used in a
production setting.
- Abstract(参考訳): AutoMLシステムは、フィーチャーの正しい処理方法を選択し、アルゴリズムを選択し、パイプライン全体のハイパーパラメータをチューニングすることで、機械学習問題に対するブラックボックスソリューションを提供する。
これらのシステムは、多くのデータセットでうまく機能するが、それでも、個々のシステムが生成するワンショットソリューションがサブパリティパフォーマンスを提供するような、不要な数のデータセットが存在する。
本稿では,自動MLソリューションを提供するフルマネージドシステムであるAmazon SageMaker Autopilotについて述べる。
表形式でのデータセットとターゲット列の名前が与えられたとき、Autopilotは問題タイプを特定し、データを解析し、特徴前処理やMLアルゴリズムを含むさまざまな完全なMLパイプラインを生成し、候補モデルのリーダーボードを生成するように調整する。
パフォーマンスが不十分なシナリオでは、データサイエンティストは、提案されたMLパイプラインを閲覧し、編集して、完全に手動のソリューションに戻ることなく、専門知識とビジネス知識を注入することができる。
本稿では、autopilotのさまざまなコンポーネントについて説明し、スケーラビリティ、高品質モデル、編集可能なmlパイプライン、オフラインメタラーニングのアーティファクトの消費、およびこれらのトレーニングされたモデルをプロダクション環境で使用できるsagemakerスイート全体と便利な統合を可能にするインフラストラクチャの選択を強調する。
関連論文リスト
- AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - Automated Machine Learning in Insurance [0.0]
本稿では,ドメイン知識のないユーザや経験のないユーザが,数行のコードを書くだけで,堅牢で労力のかかるMLデプロイメントを実現するためのAutoMLワークフローを紹介する。
提案されたAutoMLは、データ前処理のバランシングステップ、アンサンブルパイプライン、カスタマイズされた損失関数などの機能を備えた、保険アプリケーションに特化している。
論文 参考訳(メタデータ) (2024-08-26T14:55:40Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - Large Language Models for Automated Data Science: Introducing CAAFE for
Context-Aware Automated Feature Engineering [52.09178018466104]
データセットのセマンティックな特徴を生成するために、コンテキスト認識自動特徴工学(CAAFE)を導入する。
方法論的には単純だが、CAAFEは14のデータセットのうち11のパフォーマンスを改善している。
我々は,AutoMLシステムの範囲をセマンティックなAutoMLに拡張できるコンテキスト認識ソリューションの重要性を強調した。
論文 参考訳(メタデータ) (2023-05-05T09:58:40Z) - AutoEn: An AutoML method based on ensembles of predefined Machine
Learning pipelines for supervised Traffic Forecasting [1.6242924916178283]
交通予測(TF)は、将来の交通状況を予測することで交通渋滞を緩和する能力により、関連性が高まっている。
TFは、モデル選択問題(MSP)として知られる機械学習パラダイムに大きな課題を提起する。
事前に定義されたMLパイプラインの集合からマルチクラス化アンサンブルを自動生成する,シンプルで効率的な手法であるAutoEnを紹介する。
論文 参考訳(メタデータ) (2023-03-19T18:37:18Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - Automatic Componentwise Boosting: An Interpretable AutoML System [1.1709030738577393]
本稿では,高度にスケーラブルなコンポーネントワイドブースティングアルゴリズムを用いて適用可能な,解釈可能な付加モデルを構築するAutoMLシステムを提案する。
我々のシステムは、部分的な効果やペアの相互作用を可視化するなど、簡単なモデル解釈のためのツールを提供する。
解釈可能なモデル空間に制限があるにもかかわらず、我々のシステムは、ほとんどのデータセットにおける予測性能の点で競争力がある。
論文 参考訳(メタデータ) (2021-09-12T18:34:33Z) - VolcanoML: Speeding up End-to-End AutoML via Scalable Search Space
Decomposition [57.06900573003609]
VolcanoMLは、大規模なAutoML検索スペースを小さなものに分解するフレームワークである。
最新のデータベースシステムでサポートされているような、Volcanoスタイルの実行モデルをサポートしている。
評価の結果,VolcanoMLは,AutoMLにおける検索空間分解の表現性を向上するだけでなく,分解戦略の実際の発見につながることが示された。
論文 参考訳(メタデータ) (2021-07-19T13:23:57Z) - Interpret-able feedback for AutoML systems [5.5524559605452595]
自動機械学習(AutoML)システムは、非ML専門家のための機械学習(ML)モデルのトレーニングを可能にすることを目的としている。
これらのシステムの欠点は、高い精度でモデルの生成に失敗した場合、モデルを改善するためのパスがないことである。
AutoML用の解釈可能なデータフィードバックソリューションを紹介します。
論文 参考訳(メタデータ) (2021-02-22T18:54:26Z) - Evolution of Scikit-Learn Pipelines with Dynamic Structured Grammatical
Evolution [1.5224436211478214]
本稿では、動的構造文法進化(DSGE)をScikit-Learn分類パイプラインの進化に適応させる新しい文法ベースのフレームワークについて述べる。
実験結果は、AutoML-DSGEを他の文法ベースのAutoMLフレームワークであるResilient ClassificationPipeline Evolution (RECIPE)と比較することを含む。
論文 参考訳(メタデータ) (2020-04-01T09:31:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。