論文の概要: On the challenges to learn from Natural Data Streams
- arxiv url: http://arxiv.org/abs/2301.03495v1
- Date: Mon, 9 Jan 2023 16:32:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 16:04:17.617525
- Title: On the challenges to learn from Natural Data Streams
- Title(参考訳): 自然データストリームから学ぶための課題について
- Authors: Guido Borghi, Gabriele Graffieti and Davide Maltoni
- Abstract要約: 実世界のコンテキストでは、時にデータはNatural Data Streamsの形で利用することができる。
このデータ組織は、従来の機械学習アルゴリズムとディープラーニングアルゴリズムの両方にとって興味深い、かつ難しいシナリオである。
本稿では,自然データストリームの学習入力として受信する各種アルゴリズムの分類性能について検討する。
- 参考スコア(独自算出の注目度): 6.602973237811197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world contexts, sometimes data are available in form of Natural Data
Streams, i.e. data characterized by a streaming nature, unbalanced
distribution, data drift over a long time frame and strong correlation of
samples in short time ranges. Moreover, a clear separation between the
traditional training and deployment phases is usually lacking. This data
organization and fruition represents an interesting and challenging scenario
for both traditional Machine and Deep Learning algorithms and incremental
learning agents, i.e. agents that have the ability to incrementally improve
their knowledge through the past experience. In this paper, we investigate the
classification performance of a variety of algorithms that belong to various
research field, i.e. Continual, Streaming and Online Learning, that receives as
training input Natural Data Streams. The experimental validation is carried out
on three different datasets, expressly organized to replicate this challenging
setting.
- Abstract(参考訳): 実世界の状況では、データは、ストリーミングの性質、バランスのとれない分布、長いフレーム上のデータドリフト、短い時間範囲のサンプルの強い相関によって特徴付けられる、自然データストリーム形式で利用可能になることがある。
さらに、従来のトレーニングとデプロイメントフェーズの明確な分離は通常欠如しています。
このデータ組織と成果は、従来の機械学習アルゴリズムとインクリメンタル学習エージェント、すなわち過去の経験を通じて知識を漸進的に改善する能力を持つエージェントの両方にとって、興味深い、挑戦的なシナリオである。
本稿では,入力自然データストリームを学習する様々な研究分野(連続,ストリーミング,オンライン学習など)に属する様々なアルゴリズムの分類性能について検討する。
実験的な検証は3つの異なるデータセットで行われ、この困難な設定を再現するために明確に構成されている。
関連論文リスト
- RPS: A Generic Reservoir Patterns Sampler [1.09784964592609]
本稿では,ストリーミングバッチデータからの直接パターンサンプリングを容易にするために,重み付き貯水池を利用する手法を提案する。
本稿では、時間的バイアスに対処し、逐次的、重み付け、および非重み付けを含む様々なパターンタイプを処理できる汎用アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-31T16:25:21Z) - CTP: Towards Vision-Language Continual Pretraining via Compatible
Momentum Contrast and Topology Preservation [128.00940554196976]
Vision-Language Continual Pretraining (VLCP)は、大規模なデータセット上でオフラインでトレーニングすることで、さまざまな下流タスクに対して印象的な結果を示している。
VLCP(Vision-Language Continual Pretraining)の研究を支援するために,我々はまず,包括的で統一されたベンチマークデータセットP9Dをコントリビュートする。
独立したタスクとしての各業界からのデータは、継続的な学習をサポートし、Webデータの事前学習をシミュレートする現実世界のロングテールな性質に準拠している。
論文 参考訳(メタデータ) (2023-08-14T13:53:18Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Learning from Data Streams: An Overview and Update [1.5076964620370268]
教師付きデータストリーム学習の基本的定義と設定を再構築する。
教師付きデータストリーム学習タスクを構成するものについて、新たに検討する。
データストリームから学ぶことは、シングルパスやオンライン学習のアプローチを強制しない、という点が主な重点です。
論文 参考訳(メタデータ) (2022-12-30T14:01:41Z) - Towards Robust Dataset Learning [90.2590325441068]
本稿では,頑健なデータセット学習問題を定式化するための三段階最適化法を提案する。
ロバストな特徴と非ロバストな特徴を特徴付ける抽象モデルの下で,提案手法はロバストなデータセットを確実に学習する。
論文 参考訳(メタデータ) (2022-11-19T17:06:10Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Online Continual Learning with Natural Distribution Shifts: An Empirical
Study with Visual Data [101.6195176510611]
オンライン」連続学習は、情報保持とオンライン学習の有効性の両方を評価することができる。
オンライン連続学習では、入力される各小さなデータをまずテストに使用し、次にトレーニングセットに追加し、真にオンラインにします。
本稿では,大規模かつ自然な分布変化を示すオンライン連続視覚学習のための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2021-08-20T06:17:20Z) - Towards Deep Industrial Transfer Learning for Anomaly Detection on Time
Series Data [0.0]
ディープラーニングは、時間変動データセットのパフォーマンス異常検出を約束する。
ディープトランスファー学習は、異なるタスクや場所から以前の知識に基づいて構築されたアルゴリズムを緩和する。
論文 参考訳(メタデータ) (2021-06-09T08:58:56Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Adaptive Deep Forest for Online Learning from Drifting Data Streams [15.49323098362628]
データストリームから学ぶことは、現代のデータマイニングにおいて最も重要な分野である。
本稿では,樹木をベースとしたストリーミング分類器と深い森林を自然に組み合わせたアダプティブ・ディープフォレスト(ADF)を提案する。
実験により,深い森林のアプローチを効果的にオンラインアルゴリズムに変換できることが示唆された。
論文 参考訳(メタデータ) (2020-10-14T18:24:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。