論文の概要: ScarceGAN: Discriminative Classification Framework for Rare Class Identification for Longitudinal Data with Weak Prior
- arxiv url: http://arxiv.org/abs/2505.03811v1
- Date: Fri, 02 May 2025 12:17:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:35.833636
- Title: ScarceGAN: Discriminative Classification Framework for Rare Class Identification for Longitudinal Data with Weak Prior
- Title(参考訳): ScarceGAN: 弱前の経時的データに対する希少クラス識別のための識別分類フレームワーク
- Authors: Surajit Chakrabarty, Rukma Talwadker, Tridib Mukherjee,
- Abstract要約: ScarceGANは、より小さいラベルと弱いラベルを持つ長手テレメトリーデータから、極めて稀なサンプルや希少なサンプルの同定に重点を置いている。
i) データ中の有機スキューと極端に限定されたラベルの両方から生じる、正のクラスでは深刻な不足に対処する。
スキルゲームにおけるリスクのあるプレイヤーを特定するために、この定式化によって、未知の空間において非常に最小限の冗長性を持つ希少クラスの85%以上(バニラ半監督GANを60%上回る)のリコールが得られます。
- 参考スコア(独自算出の注目度): 4.2944491746735745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces ScarceGAN which focuses on identification of extremely rare or scarce samples from multi-dimensional longitudinal telemetry data with small and weak label prior. We specifically address: (i) severe scarcity in positive class, stemming from both underlying organic skew in the data, as well as extremely limited labels; (ii) multi-class nature of the negative samples, with uneven density distributions and partially overlapping feature distributions; and (iii) massively unlabelled data leading to tiny and weak prior on both positive and negative classes, and possibility of unseen or unknown behavior in the unlabelled set, especially in the negative class. Although related to PU learning problems, we contend that knowledge (or lack of it) on the negative class can be leveraged to learn the compliment of it (i.e., the positive class) better in a semi-supervised manner. To this effect, ScarceGAN re-formulates semi-supervised GAN by accommodating weakly labelled multi-class negative samples and the available positive samples. It relaxes the supervised discriminator's constraint on exact differentiation between negative samples by introducing a 'leeway' term for samples with noisy prior. We propose modifications to the cost objectives of discriminator, in supervised and unsupervised path as well as that of the generator. For identifying risky players in skill gaming, this formulation in whole gives us a recall of over 85% (~60% jump over vanilla semi-supervised GAN) on our scarce class with very minimal verbosity in the unknown space. Further ScarceGAN outperforms the recall benchmarks established by recent GAN based specialized models for the positive imbalanced class identification and establishes a new benchmark in identifying one of rare attack classes (0.09%) in the intrusion dataset from the KDDCUP99 challenge.
- Abstract(参考訳): 本稿では,ScarceGANを提案する。ScarceGANは,ラベルの小さい多次元長手テレメトリデータから,極めて稀な試料や希少な試料の同定に重点を置いている。
具体的には:
(i)データ中の有機スキューと極端に限られたラベルの両方から生じる正のクラスにおける重度の不足
二 負のサンプルの多クラスの性質、不均一密度分布及び部分的に重なり合う特徴分布
(3) 正・負の両類に先行して, 極小・弱小なデータを大量に収集し, 特に負の類において, 不可視・未知の行動の可能性について検討した。
PU学習問題に関連してはいるものの、負のクラスにおける知識(あるいはそれの欠如)を活用して、半教師付き方法でその補完(正のクラス)をより良く学習することができると論じる。
この効果のために、ScarceGANは弱ラベル付きマルチクラス負のサンプルと利用可能な正のサンプルを調節することで、半教師付きGANを再形成する。
これは、ノイズのあるサンプルに対して「リーウェイ」という用語を導入することで、負のサンプル間の正確な区別に関する教師付き判別器の制約を緩和する。
本稿では, 判別器のコスト目標, 教師なし, 教師なし経路, ジェネレータのコスト目標の変更を提案する。
スキルゲームにおけるリスクのあるプレイヤーを特定するために、この定式化によって、未知の空間において非常に最小限の冗長性を持つ希少クラスの85%以上のリコール(バニラ半教師付きGANを約60%上回る)が得られます。
さらに、ScarceGANは、最近のGANベースの正の不均衡クラス識別のための特殊モデルによって確立されたリコールベンチマークよりも優れており、KDDCUP99チャレンジからの侵入データセットの1つのレア攻撃クラス(0.09%)を特定するための新しいベンチマークを確立している。
関連論文リスト
- Anchor-based oversampling for imbalanced tabular data via contrastive and adversarial learning [2.7446241148152253]
不均衡データは、一方のクラス(マイノリティ)が他方(マイノリティ)よりも多く処理された周波数の分布を表す。
不均衡学習では、分類アルゴリズムは通常、多数派を正確に分類する傾向があり、結果として人工的に高い精度が得られる。
本研究では,不均衡学習課題に取り組むために,境界アンカーサンプルに基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-24T11:25:21Z) - Understanding Contrastive Representation Learning from Positive Unlabeled (PU) Data [28.74519165747641]
本稿では,少数のラベル付き正のセットと大きなラベル付きプールのみを利用できる,正のラベル付き学習(PU)の課題について検討する。
比較対象を減少させる非バイアスで分散した正の非ラベル型コントラスト学習(puCL)を導入する。
本稿では, 未ラベルのサンプルをソフトな正の混合物として再重み付けする, 事前認識型拡張である Positive Unlabeled InfoNCE (puNCE) を提案する。
論文 参考訳(メタデータ) (2024-02-08T20:20:54Z) - Exploring Vacant Classes in Label-Skewed Federated Learning [113.65301899666645]
本稿では,ラベルスキュード・フェデレーション学習の新しいアプローチであるFedVLSを紹介する。
空のクラス蒸留とロジット抑制を同時に統合する。
FedVLSの有効性を検証する実験は、従来のSOTA(State-of-the-art)法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-04T16:06:31Z) - Shrinking Class Space for Enhanced Certainty in Semi-Supervised Learning [59.44422468242455]
そこで我々はShrinkMatchと呼ばれる新しい手法を提案し、不確実なサンプルを学習する。
それぞれの不確実なサンプルに対して、元の Top-1 クラスを単に含むスランク類空間を適応的に求める。
次に、スランク空間における強と弱に強化された2つのサンプル間の整合正則化を課し、識別的表現を試みます。
論文 参考訳(メタデータ) (2023-08-13T14:05:24Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - NorMatch: Matching Normalizing Flows with Discriminative Classifiers for
Semi-Supervised Learning [8.749830466953584]
Semi-Supervised Learning (SSL)は、小さなラベル付きセットと大量のラベルなしデータを使ってモデルを学習することを目的としている。
この作業では、NorMatchというSSLの新しいフレームワークを紹介します。
数値的および視覚的な結果を通して、NorMatchはいくつかのデータセットで最先端のパフォーマンスを達成することを実証する。
論文 参考訳(メタデータ) (2022-11-17T15:39:18Z) - Learning from Multiple Unlabeled Datasets with Partial Risk
Regularization [80.54710259664698]
本稿では,クラスラベルを使わずに正確な分類器を学習することを目的とする。
まず、与えられたラベルのない集合から推定できる分類リスクの偏りのない推定器を導出する。
その結果、経験的リスクがトレーニング中に負になるにつれて、分類器が過度に適合する傾向があることが判明した。
実験により,本手法は,複数の未ラベル集合から学習する最先端の手法を効果的に緩和し,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-07-04T16:22:44Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。