論文の概要: SeismoFlow -- Data augmentation for the class imbalance problem
- arxiv url: http://arxiv.org/abs/2007.12229v2
- Date: Wed, 2 Sep 2020 14:42:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:03:18.748555
- Title: SeismoFlow -- Data augmentation for the class imbalance problem
- Title(参考訳): SeismoFlow -- クラス不均衡問題に対するデータ拡張
- Authors: Ruy Luiz Milidi\'u and Luis Felipe M\"uller
- Abstract要約: SeismoFlowは、合成サンプルを作成するフローベースの生成モデルである。
Glowモデルにインスパイアされたこのモデルは、学習された潜在空間を利用して、1つの稀なクラスのための合成サンプルを生成する。
希少クラスF1スコアの13.9%の改善を実現した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In several application areas, such as medical diagnosis, spam filtering,
fraud detection, and seismic data analysis, it is very usual to find relevant
classification tasks where some class occurrences are rare. This is the so
called class imbalance problem, which is a challenge in machine learning. In
this work, we propose the SeismoFlow a flow-based generative model to create
synthetic samples, aiming to address the class imbalance. Inspired by the Glow
model, it uses interpolation on the learned latent space to produce synthetic
samples for one rare class. We apply our approach to the development of a
seismogram signal quality classifier. We introduce a dataset composed
of5.223seismograms that are distributed between the good, medium, and bad
classes and with their respective frequencies of 66.68%,31.54%, and 1.76%. Our
methodology is evaluated on a stratified 10-fold cross-validation setting,
using the Miniceptionmodel as a baseline, and assessing the effects of adding
the generated samples on the training set of each iteration. In our
experiments, we achieve an improvement of 13.9% on the rare class F1-score,
while not hurting the metric value for the other classes and thus observing the
overall accuracy improvement. Our empirical findings indicate that our method
can generate high-quality synthetic seismograms with realistic looking and
sufficient plurality to help the Miniception model to overcome the class
imbalance problem. We believe that our results are a step forward in solving
both the task of seismogram signal quality classification and class imbalance.
- Abstract(参考訳): 医学診断,スパムフィルタリング,不正検出,地震データ解析などいくつかの応用分野において,いくつかの類型発生が稀な関連する分類課題を見つけることは極めて一般的である。
これはいわゆるクラス不均衡問題であり、機械学習における課題である。
本研究では, クラス不均衡に対処するため, 合成サンプル作成のための流れに基づく生成モデルを提案する。
グローモデルにインスパイアされ、学習された潜在空間の補間を使って1つのレアクラスの合成サンプルを生成する。
地震波信号品質分類器の開発に本手法を適用した。
我々は,5.223の地震図からなるデータセットを導入し,各周波数66.68%,31.54%,および1.76%の値を得た。
提案手法は,階層化された10倍のクロスバリデーション設定で評価し,Miniception Modelをベースラインとして,各イテレーションのトレーニングセットに生成したサンプルを追加する効果を評価する。
実験では, 希少クラスF1スコアの13.9%の改善が達成され, 他クラスに対するメートル法値が損なわれず, 全体的な精度改善が観察された。
実験結果から,本手法は,高品位な合成地震計を現実的な外観で生成できることを示すとともに,クラス不均衡問題を克服するための最小値モデルの実現に有効であることがわかった。
我々は,地震波信号品質分類とクラス不均衡の課題を解決するための第一歩であると考えている。
関連論文リスト
- Iterative Online Image Synthesis via Diffusion Model for Imbalanced
Classification [29.730360798234294]
医用画像分類におけるクラス不均衡問題に対処するための反復オンライン画像合成フレームワークを提案する。
このフレームワークにはオンライン画像合成(OIS)と精度適応サンプリング(AAS)という2つの重要なモジュールが組み込まれている。
不均衡な分類に対処するための提案手法の有効性を評価するため,HAM10000およびAPTOSデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-03-13T10:51:18Z) - Training Class-Imbalanced Diffusion Model Via Overlap Optimization [55.96820607533968]
実世界のデータセットで訓練された拡散モデルは、尾クラスの忠実度が劣ることが多い。
拡散モデルを含む深い生成モデルは、豊富な訓練画像を持つクラスに偏りがある。
本研究では,異なるクラスに対する合成画像の分布の重複を最小限に抑えるために,コントラスト学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-02-16T16:47:21Z) - Twice Class Bias Correction for Imbalanced Semi-Supervised Learning [59.90429949214134]
textbfTwice textbfClass textbfBias textbfCorrection (textbfTCBC) と呼ばれる新しいアプローチを導入する。
トレーニング過程におけるモデルパラメータのクラスバイアスを推定する。
非ラベル標本に対してモデルの擬似ラベルに二次補正を適用する。
論文 参考訳(メタデータ) (2023-12-27T15:06:36Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Prototype-Anchored Learning for Learning with Imperfect Annotations [83.7763875464011]
不完全な注釈付きデータセットからバイアスのない分類モデルを学ぶことは困難である。
本稿では,様々な学習に基づく分類手法に容易に組み込むことができるプロトタイプ・アンコレッド学習法を提案する。
我々は,PALがクラス不均衡学習および耐雑音学習に与える影響を,合成および実世界のデータセットに関する広範な実験により検証した。
論文 参考訳(メタデータ) (2022-06-23T10:25:37Z) - An Empirical Study on the Joint Impact of Feature Selection and Data
Resampling on Imbalance Classification [4.506770920842088]
本研究では,不均衡分類のための特徴選択とデータ再サンプリングの相乗性に着目した。
9つの特徴選択手法、クラス不均衡学習のための6つの再サンプリング手法、および3つのよく知られた分類アルゴリズムを用いて、52の公開データセットに対して多数の実験を行った。
論文 参考訳(メタデータ) (2021-09-01T06:01:51Z) - eGAN: Unsupervised approach to class imbalance using transfer learning [8.100450025624443]
クラス不均衡は、多くの機械学習分類タスクに固有の問題である。
予め訓練された画像分類モデルからエンコーダベースのGenerative Adversarial Network(eGAN)への転送学習を活用することにより、これらの不均衡に対処するための監督されていないアプローチを検討する。
CIFAR-10分類タスクにおいて0.69 F1-scoreの結果が1:2500の不均衡比で得られた。
論文 参考訳(メタデータ) (2021-04-09T02:37:55Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Oversampling Adversarial Network for Class-Imbalanced Fault Diagnosis [12.526197448825968]
クラス不均衡問題は、データをタイムリーに予測し分類できる堅牢な学習システムを必要とする。
本稿では,同時分類と故障検出のための新しい対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-07T10:12:07Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。