論文の概要: Imbalanced Continual Learning with Partitioning Reservoir Sampling
- arxiv url: http://arxiv.org/abs/2009.03632v1
- Date: Tue, 8 Sep 2020 10:28:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 20:29:20.621741
- Title: Imbalanced Continual Learning with Partitioning Reservoir Sampling
- Title(参考訳): 分割型貯留層サンプリングによる不均衡連続学習
- Authors: Chris Dongjoo Kim, Jinseo Jeong, and Gunhee Kim
- Abstract要約: シーケンシャルなデータストリームからの継続的な学習は、機械学習研究にとって重要な課題である。
予測不能な逆性は,多くの多ラベルデータセットにおいて自然に存在し,長い尾の分布を推定する。
本稿では,Reservoir Smpling (PRS) というリプレイ型アプローチのための新しいサンプリング手法を提案する。
- 参考スコア(独自算出の注目度): 46.427023757892336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continual learning from a sequential stream of data is a crucial challenge
for machine learning research. Most studies have been conducted on this topic
under the single-label classification setting along with an assumption of
balanced label distribution. This work expands this research horizon towards
multi-label classification. In doing so, we identify unanticipated adversity
innately existent in many multi-label datasets, the long-tailed distribution.
We jointly address the two independently solved problems, Catastropic
Forgetting and the long-tailed label distribution by first empirically showing
a new challenge of destructive forgetting of the minority concepts on the tail.
Then, we curate two benchmark datasets, COCOseq and NUS-WIDEseq, that allow the
study of both intra- and inter-task imbalances. Lastly, we propose a new
sampling strategy for replay-based approach named Partitioning Reservoir
Sampling (PRS), which allows the model to maintain a balanced knowledge of both
head and tail classes. We publicly release the dataset and the code in our
project page.
- Abstract(参考訳): シーケンシャルなデータストリームからの継続的な学習は、機械学習研究にとって重要な課題である。
多くの研究は、バランスのとれたラベル分布の仮定とともに、シングルラベル分類設定の下で行われている。
この研究は、マルチラベル分類に向けた研究の地平を広げる。
その際,多くのマルチラベルデータセット,すなわちロングテール分布に存在する予期せぬ逆行を識別する。
本稿は,まず,少数派の概念を忘れてしまうという新たな課題を実証的に示すことによって,独立に解決された2つの問題,カタストロピックフォーッティングと長い尾のラベル分布を共同で解決する。
次に、COCOseqとNUS-WIDEseqという2つのベンチマークデータセットをキュレートし、タスク内およびタスク間不均衡の研究を可能にする。
最後に,Reservoir Smpling (PRS) と呼ばれるリプレイ型アプローチのための新しいサンプリング手法を提案する。
データセットとコードはプロジェクトのページで公開しています。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Co-Learning Meets Stitch-Up for Noisy Multi-label Visual Recognition [70.00984078351927]
本稿では,多ラベル分類と長期学習の特徴に基づく雑音の低減に焦点をあてる。
よりクリーンなサンプルを合成し,マルチラベルノイズを直接低減するStitch-Up拡張を提案する。
ヘテロジニアス・コラーニング・フレームワークは、長い尾の分布とバランスの取れた分布の不整合を活用するためにさらに設計されている。
論文 参考訳(メタデータ) (2023-07-03T09:20:28Z) - Label-Noise Learning with Intrinsically Long-Tailed Data [65.41318436799993]
本稿では,本質的な長期データを用いたラベルノイズ学習のための学習フレームワークを提案する。
具体的には, 2段階の2次元試料選択法(TABASCO)を提案する。
論文 参考訳(メタデータ) (2022-08-21T07:47:05Z) - Learning from Label Proportions by Learning with Label Noise [30.7933303912474]
ラベル比例(LLP)からの学習は、データポイントをバッグに分類する弱い教師付き分類問題である。
ラベル雑音による学習の低減に基づくLLPに対する理論的基礎的なアプローチを提案する。
このアプローチは、複数のデータセットやアーキテクチャにわたるディープラーニングシナリオにおける経験的パフォーマンスの向上を実証する。
論文 参考訳(メタデータ) (2022-03-04T18:52:21Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Instance Credibility Inference for Few-Shot Learning [45.577880041135785]
ほとんどショットラーニングは、カテゴリごとに非常に限られたトレーニングデータを持つ新しいオブジェクトを認識することを目的としていない。
本稿では,未ラベルのインスタンスの分散サポートを数発の学習に活用するために,ICI (Instance Credibility Inference) と呼ばれる単純な統計手法を提案する。
我々の単純なアプローチは、広く使われている4つのショットラーニングベンチマークデータセットに基づいて、最先端の新たなデータセットを確立することができる。
論文 参考訳(メタデータ) (2020-03-26T12:01:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。