論文の概要: Automated Machine Learning for Multi-Label Classification
- arxiv url: http://arxiv.org/abs/2402.18198v1
- Date: Wed, 28 Feb 2024 09:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 15:35:26.532436
- Title: Automated Machine Learning for Multi-Label Classification
- Title(参考訳): マルチラベル分類のための自動機械学習
- Authors: Marcel Wever
- Abstract要約: 2つのアルゴリズムからなるシングルラベル分類タスクに対して,新しいAutoMLアプローチを考案する。
マルチラベル分類におけるAutoMLの課題複雑性を増大させるとともに,シングルラベル分類タスクにおける技術状態を形成するAutoMLアプローチがいかにスケールするかを検討する。
- 参考スコア(独自算出の注目度): 3.2634122554914002
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated machine learning (AutoML) aims to select and configure machine
learning algorithms and combine them into machine learning pipelines tailored
to a dataset at hand. For supervised learning tasks, most notably binary and
multinomial classification, aka single-label classification (SLC), such AutoML
approaches have shown promising results. However, the task of multi-label
classification (MLC), where data points are associated with a set of class
labels instead of a single class label, has received much less attention so
far. In the context of multi-label classification, the data-specific selection
and configuration of multi-label classifiers are challenging even for experts
in the field, as it is a high-dimensional optimization problem with multi-level
hierarchical dependencies. While for SLC, the space of machine learning
pipelines is already huge, the size of the MLC search space outnumbers the one
of SLC by several orders.
In the first part of this thesis, we devise a novel AutoML approach for
single-label classification tasks optimizing pipelines of machine learning
algorithms, consisting of two algorithms at most. This approach is then
extended first to optimize pipelines of unlimited length and eventually
configure the complex hierarchical structures of multi-label classification
methods. Furthermore, we investigate how well AutoML approaches that form the
state of the art for single-label classification tasks scale with the increased
problem complexity of AutoML for multi-label classification.
In the second part, we explore how methods for SLC and MLC could be
configured more flexibly to achieve better generalization performance and how
to increase the efficiency of execution-based AutoML systems.
- Abstract(参考訳): automated machine learning(automl)は、機械学習アルゴリズムを選択および構成し、手元のデータセットに合わせたマシンラーニングパイプラインに組み合わせることを目的とする。
教師付き学習タスク、特に二項・多項分類、いわゆるシングルラベル分類(SLC)については、AutoMLアプローチが有望な結果を示している。
しかし、データポイントが単一のクラスラベルではなく一連のクラスラベルに関連付けられるマルチラベル分類(mlc)のタスクは、これまであまり注目されていない。
マルチラベル分類の文脈において,マルチラベル分類器のデータ固有選択と構成は,マルチレベル階層依存性を持つ高次元最適化問題であるため,分野の専門家にとっても困難である。
SLCでは、機械学習パイプラインの空間はすでに巨大だが、MLCの検索スペースは、数桁の命令でSLCの1つを上回っている。
本論文の前半では,機械学習アルゴリズムのパイプラインを最適化する単一ラベル分類タスクに対して,最大2つのアルゴリズムからなる新しいAutoMLアプローチを考案した。
このアプローチは最初、無限長のパイプラインを最適化するために拡張され、最終的にはマルチラベル分類法の複雑な階層構造を構成する。
さらに,マルチラベル分類におけるAutoMLの問題点を増大させるとともに,単一ラベル分類タスクにおける技術状態を形成するAutoMLアプローチがいかにスケールするかを検討する。
第2部では,SLC と MLC の手法をより柔軟に構成して,より優れた一般化性能を実現し,実行ベース AutoML システムの効率を向上させる方法について検討する。
関連論文リスト
- AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - Automated Contrastive Learning Strategy Search for Time Series [48.68664732145665]
時系列データセットやタスクに対するコントラスト学習(AutoCL)を自動的に学習する,MicrosoftのAutomated Machine Learning(AutoML)プラクティスを提示する。
まず,データ拡張,埋め込み変換,コントラッシブなペア構成,コントラスト的な損失を網羅した,3時間1012ドルの探索空間を構築した。
さらに,評価タスクの性能からCLSを最適化し,空間内で有効なCLSを得る効率的な強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-19T11:24:14Z) - Bringing Quantum Algorithms to Automated Machine Learning: A Systematic
Review of AutoML Frameworks Regarding Extensibility for QML Algorithms [1.4469725791865982]
本稿では、量子機械学習(QML)アルゴリズムを組み込む能力について、既存のAutoMLフレームワークの選択アプローチと分析について述べる。
そのため、利用可能なオープンソースツールは市場概要に集約され、適切なフレームワークは、マルチフェーズのマルチ基準アプローチで体系的に選択されます。
ハードウェアおよびソフトウェア制約に対するQC固有のパイプラインステップと決定特性を備えた拡張型量子機械学習(AutoQML)フレームワークを構築した。
論文 参考訳(メタデータ) (2023-10-06T13:21:16Z) - Multi-Instance Partial-Label Learning: Towards Exploiting Dual Inexact
Supervision [53.530957567507365]
実世界のタスクでは、各トレーニングサンプルは、1つの基底真実ラベルといくつかの偽陽性ラベルを含む候補ラベルセットに関連付けられている。
本稿では,Multi-instance partial-label learning (MIPL) などの問題を定式化する。
既存のマルチインスタンス学習アルゴリズムと部分ラベル学習アルゴリズムはMIPL問題の解法に最適である。
論文 参考訳(メタデータ) (2022-12-18T03:28:51Z) - Benchmarking AutoML algorithms on a collection of binary problems [3.3793659640122717]
本稿では,Tree-based Pipeline Optimization Tool (TPOT), Auto-Sklearn, Auto-Sklearn 2, H2O AutoMLの4種類のAutoMLアルゴリズムの性能を比較した。
私たちはAutoMLがすべての含まれたデータセットでうまく機能するパイプラインを識別できることを確認します。
論文 参考訳(メタデータ) (2022-12-06T01:53:50Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Many-Class Few-Shot Learning on Multi-Granularity Class Hierarchy [57.68486382473194]
我々は,教師付き学習とメタ学習の両方において,MCFS(Multi-class few-shot)問題について検討した。
本稿では,クラス階層を事前知識として活用し,粗大な分類器を訓練する。
モデル「メモリ拡張階層分類ネットワーク(MahiNet)」は、各粗いクラスが複数の細かなクラスをカバーできる粗い粒度分類を行う。
論文 参考訳(メタデータ) (2020-06-28T01:11:34Z) - Is deep learning necessary for simple classification tasks? [3.3793659640122717]
自動機械学習(Automated Machine Learning、ML)とディープラーニング(Deep Learning、DL)は、帰納的学習タスクを解決するために使用される最先端のパラダイムである。
6つのよく認識された公開データセットのバイナリ分類の文脈でAutoMLとDLを比較した。
また、深部推定器を組み込んだ遺伝的プログラミングに基づくAutoMLの新しいツールの評価を行った。
論文 参考訳(メタデータ) (2020-06-11T18:41:47Z) - A Robust Experimental Evaluation of Automated Multi-Label Classification
Methods [0.735996217853436]
本稿では,マルチラベル分類(MLC)問題に対するAutoMLにアプローチする。
MLCでは、それぞれの例を複数のクラスラベルに同時に関連付けることができる。
全体として、最も顕著な方法は、標準文法に基づく遺伝的プログラミング(GGP)探索法に基づくものである。
論文 参考訳(メタデータ) (2020-05-16T20:08:04Z) - Evolution of Scikit-Learn Pipelines with Dynamic Structured Grammatical
Evolution [1.5224436211478214]
本稿では、動的構造文法進化(DSGE)をScikit-Learn分類パイプラインの進化に適応させる新しい文法ベースのフレームワークについて述べる。
実験結果は、AutoML-DSGEを他の文法ベースのAutoMLフレームワークであるResilient ClassificationPipeline Evolution (RECIPE)と比較することを含む。
論文 参考訳(メタデータ) (2020-04-01T09:31:34Z) - AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data [120.2298620652828]
オープンソースのAutoMLフレームワークであるAutoGluon-Tabularを紹介します。
KaggleとOpenML AutoML Benchmarkの50の分類および回帰タスクからなるスイートのテストによると、AutoGluonはより速く、より堅牢で、はるかに正確である。
論文 参考訳(メタデータ) (2020-03-13T23:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。