論文の概要: Binary Classification: Counterbalancing Class Imbalance by Applying
Regression Models in Combination with One-Sided Label Shifts
- arxiv url: http://arxiv.org/abs/2011.14764v1
- Date: Mon, 30 Nov 2020 13:24:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 02:37:22.653534
- Title: Binary Classification: Counterbalancing Class Imbalance by Applying
Regression Models in Combination with One-Sided Label Shifts
- Title(参考訳): 二分分類:回帰モデルと片面ラベルシフトを併用した逆バランスクラス不均衡
- Authors: Peter Bellmann, Heinke Hihn, Daniel A. Braun, Friedhelm Schwenker
- Abstract要約: クラス不均衡の問題に対処する新しい手法を提案する。
我々は、対応する回帰タスクが均衡するように、負と正の目標ラベルのセットを生成する。
我々は,複数の公開データセットに対するアプローチを評価し,提案手法を最もポピュラーなオーバーサンプリング手法と比較した。
- 参考スコア(独自算出の注目度): 0.4970364068620607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many real-world pattern recognition scenarios, such as in medical
applications, the corresponding classification tasks can be of an imbalanced
nature. In the current study, we focus on binary, imbalanced classification
tasks, i.e.~binary classification tasks in which one of the two classes is
under-represented (minority class) in comparison to the other class (majority
class). In the literature, many different approaches have been proposed, such
as under- or oversampling, to counter class imbalance. In the current work, we
introduce a novel method, which addresses the issues of class imbalance. To
this end, we first transfer the binary classification task to an equivalent
regression task. Subsequently, we generate a set of negative and positive
target labels, such that the corresponding regression task becomes balanced,
with respect to the redefined target label set. We evaluate our approach on a
number of publicly available data sets in combination with Support Vector
Machines. Moreover, we compare our proposed method to one of the most popular
oversampling techniques (SMOTE). Based on the detailed discussion of the
presented outcomes of our experimental evaluation, we provide promising ideas
for future research directions.
- Abstract(参考訳): 医学応用のような現実世界のパターン認識のシナリオでは、対応する分類タスクは不均衡な性質を持つ。
本研究は,2つのクラスのうちの1つが非表現的(マイノリティクラス)であり,他のクラス(マイノリティクラス)と比較して非表現的(マイノリティクラス)な分類タスクである。
文献では、クラス不均衡に対処するアンダーサンプリングやオーバーサンプリングなど、多くの異なるアプローチが提案されている。
そこで本研究では,クラス不均衡の問題に対処する新しい手法を提案する。
この目的のために、まず二項分類タスクを等価回帰タスクに転送する。
その後、再定義されたターゲットラベルセットに対して、対応する回帰タスクがバランスをとるように、負のターゲットラベルと正のターゲットラベルのセットを生成する。
我々は,Support Vector Machinesと組み合わせて,利用可能な多数のデータセットに対するアプローチを評価した。
さらに,提案手法を,最も一般的なオーバーサンプリング手法の一つであるSMOTEと比較した。
実験評価の結果の詳細な議論に基づいて,今後の研究方向性に期待できるアイデアを提供する。
関連論文リスト
- Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。
均一分布仮定に依存しない一貫したアプローチを提案する。
相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文 参考訳(メタデータ) (2023-11-27T02:59:17Z) - Deep Imbalanced Regression via Hierarchical Classification Adjustment [50.19438850112964]
コンピュータビジョンにおける回帰タスクは、しばしば、対象空間をクラスに定量化することで分類される。
トレーニングサンプルの大多数は目標値の先頭にあるが、少数のサンプルは通常より広い尾幅に分布する。
不均衡回帰タスクを解くために階層型分類器を構築することを提案する。
不均衡回帰のための新しい階層型分類調整(HCA)は,3つのタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2023-10-26T04:54:39Z) - Mutual Exclusive Modulator for Long-Tailed Recognition [12.706961256329572]
ロングテール認識は、カテゴリー間で極めて不均衡なトレーニングサンプルを与えられた高性能分類器を学習するタスクである。
各グループに属する画像の確率を推定できる相互排他変調器を導入する。
提案手法は,最先端のベンチマークと比較すると,競争性能が向上する。
論文 参考訳(メタデータ) (2023-02-19T07:31:49Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - Equity-Directed Bootstrapping: Examples and Analysis [3.007949058551534]
エクイティ指向のブートストラップがテストセットの感度と特異性を、同等のオッズ基準を満たすためにいかに近づけるかを示す。
ナイーブベイズとロジスティックレグレッションの文脈で、私たちは、エクイティ指向のブートストラップを分析し、オッズ比を1に近いものにすることで機能することを示した。
論文 参考訳(メタデータ) (2021-08-14T22:09:27Z) - Statistical Theory for Imbalanced Binary Classification [8.93993657323783]
最適分類性能は、これまで形式化されていなかったクラス不均衡の特定の性質に依存することを示す。
具体的には、一様クラス不均衡と呼ばれる新しいクラス不均衡のサブタイプを提案する。
これらの結果は、不均衡二項分類に対する最初の有意義な有限サンプル統計理論のいくつかを提供する。
論文 参考訳(メタデータ) (2021-07-05T03:55:43Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - SetConv: A New Approach for Learning from Imbalanced Data [29.366843553056594]
集合畳み込み操作とエピソード学習戦略を提案し,各クラスに1つの代表を抽出する。
提案アルゴリズムは入力順序に関わらず置換不変であることを示す。
論文 参考訳(メタデータ) (2021-04-03T22:33:30Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - M2m: Imbalanced Classification via Major-to-minor Translation [79.09018382489506]
ほとんどの実世界のシナリオでは、ラベル付きトレーニングデータセットは非常にクラス不均衡であり、ディープニューラルネットワークは、バランスの取れたテスト基準への一般化に苦しむ。
本稿では,より頻度の低いクラスを,より頻度の低いクラスからのサンプルを翻訳することによって,この問題を緩和する新しい方法を提案する。
提案手法は,従来の再サンプリング法や再重み付け法と比較して,マイノリティクラスの一般化を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-04-01T13:21:17Z) - Imbalanced classification: a paradigm-based review [21.578692329486643]
クラス不均衡問題に対処する複数の再サンプリング手法が提案されている。
それぞれのテクニックをいつ使うかについては、一般的なガイダンスはない。
不均衡なクラスサイズ下でのバイナリ分類のための共通再サンプリング手法をパラダイムベースでレビューする。
論文 参考訳(メタデータ) (2020-02-11T18:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。