論文の概要: Towards Stable Imbalanced Data Classification via Virtual Big Data
Projection
- arxiv url: http://arxiv.org/abs/2009.08387v1
- Date: Sun, 23 Aug 2020 04:01:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 02:45:49.244542
- Title: Towards Stable Imbalanced Data Classification via Virtual Big Data
Projection
- Title(参考訳): 仮想ビッグデータ投影による安定的不均衡データの分類に向けて
- Authors: Hadi Mansourifar, Weidong Shi
- Abstract要約: 深層オートエンコーダ訓練と不均衡データ分類に対処するVBDの能力について検討する。
まず、VBDは、膨大な多様なトレーニングデータを提供することで、オートエンコーダのバリデーション損失を著しく低減できることを示す。
第2に、オーバーサンプリングを伴わないスキュートクラス分布のバランスをとるために、クロスコンカニエーションと呼ばれる最初のプロジェクションベース手法を提案する。
- 参考スコア(独自算出の注目度): 3.3707422585608953
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual Big Data (VBD) proved to be effective to alleviate mode collapse and
vanishing generator gradient as two major problems of Generative Adversarial
Neural Networks (GANs) very recently. In this paper, we investigate the
capability of VBD to address two other major challenges in Machine Learning
including deep autoencoder training and imbalanced data classification. First,
we prove that, VBD can significantly decrease the validation loss of
autoencoders via providing them a huge diversified training data which is the
key to reach better generalization to minimize the over-fitting problem.
Second, we use the VBD to propose the first projection-based method called
cross-concatenation to balance the skewed class distributions without
over-sampling. We prove that, cross-concatenation can solve uncertainty problem
of data driven methods for imbalanced classification.
- Abstract(参考訳): VBD(Virtual Big Data)は,最近になってGAN(Generative Adversarial Neural Networks)の2つの大きな問題として,モード崩壊とジェネレータ勾配の解消に有効であることが判明した。
本稿では,Deep Autoencoderトレーニングと不均衡データ分類を含む,機械学習における2つの大きな課題に対処するVBDの能力について検討する。
まず、VBDは、過度に適合する問題を最小化するために、より良い一般化に到達するための鍵となる巨大な多角化トレーニングデータを提供することにより、オートエンコーダの検証損失を著しく低減できることを示す。
第二に、VBDを用いてクロスコンカニエーションと呼ばれる最初のプロジェクションベースの手法を提案し、オーバーサンプリングなしでスキュートクラス分布のバランスをとる。
クロス結合は不均衡分類のためのデータ駆動手法の不確実性問題を解決できることを実証する。
関連論文リスト
- Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network [4.8748194765816955]
本研究では、自己エンコーダに基づくデータ拡張技術と畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。
提案手法は,ランダムフォレスト,SVM,ロジスティック回帰をそれぞれ19%,21%,27%以上,98.56%の分類精度を達成している。
論文 参考訳(メタデータ) (2024-11-17T10:19:54Z) - Revisiting the Disequilibrium Issues in Tackling Heart Disease Classification Tasks [5.834731599084117]
心臓病の分類の分野では2つの主要な障害が生じる。
心電図(ECG)データセットは、様々なモードにおける不均衡とバイアスを一貫して示している。
信号符号化画像に対してチャネルワイド・マグニチュード等化器(CME)を提案する。
また、データ間の不均衡を軽減するために、逆重対数損失(IWL)を提案する。
論文 参考訳(メタデータ) (2024-07-19T09:50:49Z) - Simple Ingredients for Offline Reinforcement Learning [86.1988266277766]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。
既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。
アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文 参考訳(メタデータ) (2024-03-19T18:57:53Z) - P$^2$OT: Progressive Partial Optimal Transport for Deep Imbalanced
Clustering [16.723646401890495]
深層クラスタリングのための新しい擬似ラベル学習フレームワークを提案する。
本フレームワークは,高信頼度サンプルから不均衡を意識した擬似ラベルと学習を生成する。
CIFAR100を含む様々なデータセットの実験は,本手法の優位性を実証している。
論文 参考訳(メタデータ) (2024-01-17T15:15:46Z) - Diversity-enhancing Generative Network for Few-shot Hypothesis
Adaptation [135.80439360370556]
本稿では,FHA問題に対する多様性向上型生成ネットワーク(DEG-Net)を提案する。
カーネル独立対策(Hilbert-Schmidt independent criterion、HSIC)の助けを借りて、さまざまなラベルのないデータを生成することができる。
論文 参考訳(メタデータ) (2023-07-12T06:29:02Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。
ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。
合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T08:04:12Z) - Fine-grained Data Distribution Alignment for Post-Training Quantization [100.82928284439271]
学習後量子化の性能を高めるために,データ分散アライメント(FDDA)法を提案する。
提案手法は,特に第1層と第2層が低ビットに量子化されている場合,ImageNet上での最先端性能を示す。
論文 参考訳(メタデータ) (2021-09-09T11:45:52Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Mitigating Dataset Imbalance via Joint Generation and Classification [17.57577266707809]
教師付きディープラーニング手法は、コンピュータビジョンの多くの実践的応用において大きな成功を収めている。
バイアスや不均衡データに対する顕著な性能劣化は、これらの手法の信頼性に疑問を投げかける。
ニューラルネットワーク分類器とGAN(Generative Adversarial Networks)を組み合わせた共同データセット修復戦略を提案する。
重度のクラス不均衡に対する分類器とGANの堅牢性向上に寄与することを示す。
論文 参考訳(メタデータ) (2020-08-12T18:40:38Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。