論文の概要: Nonstationary data stream classification with online active learning and
siamese neural networks
- arxiv url: http://arxiv.org/abs/2210.01090v1
- Date: Mon, 3 Oct 2022 17:16:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 16:46:25.308331
- Title: Nonstationary data stream classification with online active learning and
siamese neural networks
- Title(参考訳): オンラインアクティブラーニングとサイムズニューラルネットワークを用いた非定常データストリーム分類
- Authors: Kleanthis Malialis and Christos G. Panayiotou and Marios M. Polycarpou
- Abstract要約: 予測モデルをオンザフライでトレーニングするオンライン学習方法に対する新たなニーズ。
しかし、一連のオープンな課題は、実際にデプロイを妨げている。
本稿では,オンラインアクティブラーニング,シアムネットワーク,マルチキューメモリを組み合わせることで,これらの課題に対処するActiSiameseアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 11.501721946030779
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We have witnessed in recent years an ever-growing volume of information
becoming available in a streaming manner in various application areas. As a
result, there is an emerging need for online learning methods that train
predictive models on-the-fly. A series of open challenges, however, hinder
their deployment in practice. These are, learning as data arrive in real-time
one-by-one, learning from data with limited ground truth information, learning
from nonstationary data, and learning from severely imbalanced data, while
occupying a limited amount of memory for data storage. We propose the
ActiSiamese algorithm, which addresses these challenges by combining online
active learning, siamese networks, and a multi-queue memory. It develops a new
density-based active learning strategy which considers similarity in the latent
(rather than the input) space. We conduct an extensive study that compares the
role of different active learning budgets and strategies, the performance
with/without memory, the performance with/without ensembling, in both synthetic
and real-world datasets, under different data nonstationarity characteristics
and class imbalance levels. ActiSiamese outperforms baseline and
state-of-the-art algorithms, and is effective under severe imbalance, even only
when a fraction of the arriving instances' labels is available. We publicly
release our code to the community.
- Abstract(参考訳): 近年、さまざまなアプリケーション領域でストリーミング方式で利用できる情報が増え続けているのを目撃しています。
その結果、予測モデルをオンザフライでトレーニングするオンライン学習方法の必要性が高まっている。
しかし、一連のオープンチャレンジは、実際にデプロイを妨げている。
データはリアルタイムで1対1で学習し、限られた真理情報を持つデータから学習し、非定常データから学習し、厳しい不均衡データから学習し、データストレージのための限られたメモリを占有する。
本稿では,オンラインアクティブラーニング,シアムネットワーク,マルチキューメモリを組み合わせることで,これらの課題に対処するActiSiameseアルゴリズムを提案する。
潜在(入力ではなく)空間における類似性を考慮した,新たな密度ベースのアクティブラーニング戦略を開発した。
本研究では,様々なデータ非定常特性とクラス不均衡レベルにおいて,異なるアクティブラーニング予算と戦略,メモリ使用/無使用性能,合成データと実世界のデータセットにおける性能と無感覚性能の比較を行った。
ActiSiameseはベースラインと最先端のアルゴリズムより優れており、到着したインスタンスのラベルのごく一部が利用可能であっても、深刻な不均衡の下で有効である。
私たちはコードをコミュニティに公開しています。
関連論文リスト
- CTP: Towards Vision-Language Continual Pretraining via Compatible
Momentum Contrast and Topology Preservation [128.00940554196976]
Vision-Language Continual Pretraining (VLCP)は、大規模なデータセット上でオフラインでトレーニングすることで、さまざまな下流タスクに対して印象的な結果を示している。
VLCP(Vision-Language Continual Pretraining)の研究を支援するために,我々はまず,包括的で統一されたベンチマークデータセットP9Dをコントリビュートする。
独立したタスクとしての各業界からのデータは、継続的な学習をサポートし、Webデータの事前学習をシミュレートする現実世界のロングテールな性質に準拠している。
論文 参考訳(メタデータ) (2023-08-14T13:53:18Z) - Data Quality in Imitation Learning [15.939363481618738]
ロボット工学のオフライン学習では、インターネットのスケールデータがないだけで、高品質なデータセットが必要なのです。
これは特に、専門家によるデモンストレーションを用いたロボット学習のためのサンプル効率のよいパラダイムである模倣学習(IL)において当てはまる。
本研究では,分散シフトのレンズによる模倣学習のためのデータ品質の形式化に向けた第一歩を踏み出す。
論文 参考訳(メタデータ) (2023-06-04T18:48:32Z) - Responsible Active Learning via Human-in-the-loop Peer Study [88.01358655203441]
我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。
まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
論文 参考訳(メタデータ) (2022-11-24T13:18:27Z) - Data augmentation on-the-fly and active learning in data stream
classification [9.367903089535684]
予測モデルをオンザフライでトレーニングする必要性が高まっている。
学習モデルは、アクティブな学習予算を増やすことなく、より多くのラベル付きデータにアクセスすることができる。
Augmented Queuesは、学習の質とスピードに関して、パフォーマンスを著しく向上させる。
論文 参考訳(メタデータ) (2022-10-13T09:57:08Z) - Online Continual Learning on a Contaminated Data Stream with Blurry Task
Boundaries [17.43350151320054]
大量の連続学習(CL)手法は、クリーンなラベルを持つデータストリームを前提としており、ノイズの多いデータストリームの下でのオンライン学習シナリオはまだ探索されていない。
我々は、既存のCLメソッドが苦労しているラベル付きぼやけたデータストリームからオンライン学習のより実践的なCLタスク設定について検討する。
本稿では,ラベルノイズを意識した多様なサンプリングと,半教師付き学習による頑健な学習の統一的アプローチにより,メモリの管理と利用を行う新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:52:45Z) - Learning from Heterogeneous Data Based on Social Interactions over
Graphs [58.34060409467834]
本研究では,個別のエージェントが異なる次元のストリーミング特徴を観察しながら分類問題の解決を目指す分散アーキテクチャを提案する。
私たちはそれを示します。
戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
私たちはそれを示します。
戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
論文 参考訳(メタデータ) (2021-12-17T12:47:18Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Data-efficient Online Classification with Siamese Networks and Active
Learning [11.501721946030779]
オンライン分類におけるラベル付き・非定常・不均衡データからの学習について検討する。
本研究では,シアムニューラルネットワークとアクティブラーニングを相乗的に組み合わせた学習手法を提案する。
提案手法はデータの非定常性と不均衡に対して頑健であり,学習速度と性能の両面で,ベースラインと最先端アルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2020-10-04T19:07:19Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。