論文の概要: Fase-AL -- Adaptation of Fast Adaptive Stacking of Ensembles for
Supporting Active Learning
- arxiv url: http://arxiv.org/abs/2001.11466v1
- Date: Thu, 30 Jan 2020 17:25:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 11:26:29.759904
- Title: Fase-AL -- Adaptation of Fast Adaptive Stacking of Ensembles for
Supporting Active Learning
- Title(参考訳): Fase-AL -- アクティブラーニングを支援するアンサンブルの適応的高速化
- Authors: Agust\'in Alejandro Ortiz-D\'iaz, Fabiano Baldo, Laura Mar\'ia
Palomino Mari\~no and Alberto Verdecia Cabrera
- Abstract要約: 本研究は,Active Learning を用いて非ラベルのインスタンスで分類モデルを誘導する FASE-AL アルゴリズムを提案する。
このアルゴリズムは、正しく分類されたインスタンスの割合で有望な結果を得る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification algorithms to mine data stream have been extensively studied
in recent years. However, a lot of these algorithms are designed for supervised
learning which requires labeled instances. Nevertheless, the labeling of the
data is costly and time-consuming. Because of this, alternative learning
paradigms have been proposed to reduce the cost of the labeling process without
significant loss of model performance. Active learning is one of these
paradigms, whose main objective is to build classification models that request
the lowest possible number of labeled examples achieving adequate levels of
accuracy. Therefore, this work presents the FASE-AL algorithm which induces
classification models with non-labeled instances using Active Learning. FASE-AL
is based on the algorithm Fast Adaptive Stacking of Ensembles (FASE). FASE is
an ensemble algorithm that detects and adapts the model when the input data
stream has concept drift. FASE-AL was compared with four different strategies
of active learning found in the literature. Real and synthetic databases were
used in the experiments. The algorithm achieves promising results in terms of
the percentage of correctly classified instances.
- Abstract(参考訳): データストリームをマイニングするための分類アルゴリズムは近年広く研究されている。
しかし、これらのアルゴリズムの多くはラベル付きインスタンスを必要とする教師付き学習のために設計されている。
それでもデータのラベル付けは高価で時間を要する。
このため、モデル性能を著しく損なうことなくラベル付けプロセスのコストを削減するための代替学習パラダイムが提案されている。
アクティブラーニングはこれらのパラダイムの1つであり、その主な目的は、適切な精度のレベルを達成するラベル付きサンプルの最小数を要求する分類モデルを構築することである。
そこで本研究では,Active Learningを用いて非ラベルのインスタンスで分類モデルを生成するFASE-ALアルゴリズムを提案する。
FASE-ALはFASE(Fast Adaptive Stacking of Ensembles)アルゴリズムに基づいている。
FASEは、入力データストリームがコンセプトドリフトを持つときにモデルを検出し、適応するアンサンブルアルゴリズムである。
FASE-ALは本研究で発見された4つの活動的学習戦略と比較した。
実験には実データと合成データベースが使われた。
このアルゴリズムは、正しく分類されたインスタンスの割合で有望な結果を得る。
関連論文リスト
- Classification Tree-based Active Learning: A Wrapper Approach [4.706932040794696]
本稿では,木構造にサンプリングプロセスを整理し,分類のためのラッパー能動的学習法を提案する。
ラベル付き標本の初期集合上に構築された分類木は、空間を低エントロピー領域に分解すると考えられる。
この適応は、既存のアクティブラーニング手法よりも大幅に向上することが証明されている。
論文 参考訳(メタデータ) (2024-04-15T17:27:00Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - NTKCPL: Active Learning on Top of Self-Supervised Model by Estimating
True Coverage [3.4806267677524896]
ニューラル・タンジェント・カーネル・クラスタリング・プシュード・ラベル(NTKCPL)の新しいアクティブ・ラーニング・ストラテジーを提案する。
擬似ラベルとNTK近似を用いたモデル予測に基づいて経験的リスクを推定する。
提案手法を5つのデータセット上で検証し,ほとんどの場合,ベースライン法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-07T01:43:47Z) - Neural Active Learning on Heteroskedastic Distributions [29.01776999862397]
ヘテロスケダスティックデータセット上でのアクティブ学習アルゴリズムの破滅的な失敗を実証する。
本稿では,各データポイントにモデル差分スコアリング関数を組み込んで,ノイズの多いサンプルとサンプルクリーンなサンプルをフィルタするアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-02T07:30:19Z) - Active Transfer Prototypical Network: An Efficient Labeling Algorithm
for Time-Series Data [1.7205106391379026]
本稿では,プロトタイプネットワーク(ProtoNet)をALイテレーションに組み込むことで,トレードオフ問題に対処する新しいFew-Shot Learning(FSL)ベースのALフレームワークを提案する。
このフレームワークは、UCI HAR/HAPTデータセットと現実世界のブレーキ操作データセットに基づいて検証された。
学習性能は、両方のデータセットにおける従来のALアルゴリズムを大幅に上回り、それぞれ10%と5%のラベル付け作業で90%の分類精度を達成した。
論文 参考訳(メタデータ) (2022-09-28T16:14:40Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - BALanCe: Deep Bayesian Active Learning via Equivalence Class Annealing [7.9107076476763885]
BALanCeは、不確実性推定の効果を緩和する、深いアクティブな学習フレームワークである。
Batch-BALanCeは、逐次アルゴリズムのバッチ設定への一般化である。
Batch-BALanCeは、アクティブな学習のためのいくつかのベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-12-27T15:38:27Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。