論文の概要: Automated Machine Learning Techniques for Data Streams
- arxiv url: http://arxiv.org/abs/2106.07317v1
- Date: Mon, 14 Jun 2021 11:42:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 00:32:13.931312
- Title: Automated Machine Learning Techniques for Data Streams
- Title(参考訳): データストリームのための自動機械学習技術
- Authors: Alexandru-Ionut Imbrea
- Abstract要約: 本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
- 参考スコア(独自算出の注目度): 91.3755431537592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated machine learning techniques benefited from tremendous research
progress in recently. These developments and the continuous-growing demand for
machine learning experts led to the development of numerous AutoML tools.
However, these tools assume that the entire training dataset is available
upfront and that the underlying distribution does not change over time. These
assumptions do not hold in a data stream mining setting where an unbounded
stream of data cannot be stored and is likely to manifest concept drift.
Industry applications of machine learning on streaming data become more popular
due to the increasing adoption of real-time streaming patterns in IoT,
microservices architectures, web analytics, and other fields. The research
summarized in this paper surveys the state-of-the-art open-source AutoML tools,
applies them to data collected from streams, and measures how their performance
changes over time. For comparative purposes, batch, batch incremental and
instance incremental estimators are applied and compared. Moreover, a
meta-learning technique for online algorithm selection based on meta-feature
extraction is proposed and compared while model replacement and continual
AutoML techniques are discussed. The results show that off-the-shelf AutoML
tools can provide satisfactory results but in the presence of concept drift,
detection or adaptation techniques have to be applied to maintain the
predictive accuracy over time.
- Abstract(参考訳): 自動化された機械学習技術は、最近の大きな研究の進歩から恩恵を受けた。
これらの開発と機械学習の専門家の継続的な需要は、多数のAutoMLツールの開発につながった。
しかし、これらのツールはトレーニングデータセット全体が事前に利用可能であり、基礎となるディストリビューションは時間とともに変化しないと仮定する。
これらの仮定は、無制限のデータストリームを保存できないデータストリームマイニング設定に保持されず、概念ドリフトを顕示する可能性が高い。
ストリーミングデータに対する機械学習の産業的応用は、IoTやマイクロサービスアーキテクチャ、Webアナリティクスなどの分野におけるリアルタイムストリーミングパターンの採用の増加により、ますます人気が高まっている。
本稿では、最先端のオープンソースautomlツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
比較のために、バッチ、バッチインクリメンタル、インスタンスインクリメンタル推定が適用され、比較される。
さらに,メタ機能抽出に基づくオンラインアルゴリズム選択のためのメタ学習手法を提案し,モデル置換と連続オートML技術の比較を行った。
その結果, 市販のautomlツールは良好な結果が得られるが, 概念ドリフトの存在下では, 予測精度を維持するためには, 検出や適応手法を適用する必要がある。
関連論文リスト
- Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [71.63186089279218]
本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文 参考訳(メタデータ) (2023-09-13T17:55:11Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Online AutoML: An adaptive AutoML framework for online learning [6.6389732792316005]
本研究では,データドリフトに継続的に適応しながら,オンライン学習のためのパイプライン設計を自動化することを目的とする。
このシステムは,オンライン学習者固有の適応能力とAutoMLの高速自動パイプライン(再最適化機能)を組み合わせる。
論文 参考訳(メタデータ) (2022-01-24T15:37:20Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Man versus Machine: AutoML and Human Experts' Role in Phishing Detection [4.124446337711138]
本稿では,10種類のフィッシングデータセット上での6つの最先端AutoMLフレームワークのパフォーマンスを比較した。
以上の結果から,AutoMLベースのモデルでは,複雑な分類タスクにおいて,手作業で開発した機械学習モデルよりも優れていることが示唆された。
論文 参考訳(メタデータ) (2021-08-27T09:26:20Z) - AutoML to Date and Beyond: Challenges and Opportunities [30.60364966752454]
AutoMLツールは、機械学習を非機械学習の専門家が利用できるようにすることを目的としている。
本稿では,AutoMLシステムのための新しい分類システムを提案する。
エンド・ツー・エンドの機械学習パイプラインのさらなる自動化に必要な研究を指摘して、将来のロードマップを策定しました。
論文 参考訳(メタデータ) (2020-10-21T06:08:21Z) - Adaptation Strategies for Automated Machine Learning on Evolving Data [7.843067454030999]
本研究は,概念ドリフトなどのデータストリーム課題がAutoML手法の性能に及ぼす影響を理解することを目的とする。
本稿では,6つの概念ドリフト適応戦略を提案し,それらの有効性を異なるAutoMLアプローチで評価する。
論文 参考訳(メタデータ) (2020-06-09T14:29:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。