論文の概要: AutoBalance: Optimized Loss Functions for Imbalanced Data
- arxiv url: http://arxiv.org/abs/2201.01212v1
- Date: Tue, 4 Jan 2022 15:53:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 14:01:25.373379
- Title: AutoBalance: Optimized Loss Functions for Imbalanced Data
- Title(参考訳): オートバランス:不均衡データに対する最適損失関数
- Authors: Mingchen Li, Xuechen Zhang, Christos Thrampoulidis, Jiasi Chen, Samet
Oymak
- Abstract要約: 本稿では,2段階最適化フレームワークであるAutoBalanceを提案する。
具体的には、下層問題はモデル重みを訓練し、上層問題は、検証データに対して所望の目的を監視、最適化することにより損失関数を調整する。
我々の損失設計は、パラメトリックなクロスエントロピー損失と個別化されたデータ拡張スキームを用いて、クラス/グループをパーソナライズすることを可能にする。
- 参考スコア(独自算出の注目度): 38.64606886588534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imbalanced datasets are commonplace in modern machine learning problems. The
presence of under-represented classes or groups with sensitive attributes
results in concerns about generalization and fairness. Such concerns are
further exacerbated by the fact that large capacity deep nets can perfectly fit
the training data and appear to achieve perfect accuracy and fairness during
training, but perform poorly during test. To address these challenges, we
propose AutoBalance, a bi-level optimization framework that automatically
designs a training loss function to optimize a blend of accuracy and
fairness-seeking objectives. Specifically, a lower-level problem trains the
model weights, and an upper-level problem tunes the loss function by monitoring
and optimizing the desired objective over the validation data. Our loss design
enables personalized treatment for classes/groups by employing a parametric
cross-entropy loss and individualized data augmentation schemes. We evaluate
the benefits and performance of our approach for the application scenarios of
imbalanced and group-sensitive classification. Extensive empirical evaluations
demonstrate the benefits of AutoBalance over state-of-the-art approaches. Our
experimental findings are complemented with theoretical insights on loss
function design and the benefits of train-validation split. All code is
available open-source.
- Abstract(参考訳): 不均衡データセットは、現代の機械学習問題でよく見られる。
センシティブな属性を持つクラスやグループの存在は、一般化と公平性に関する懸念をもたらす。
このような懸念は、大容量のディープネットがトレーニングデータに完全に適合し、トレーニング中に完全な正確さと公平性を達成できるが、テスト中は不十分であるという事実によってさらに悪化する。
これらの課題に対処するために,トレーニング損失関数を自動設計し,精度と公正性を求める目的のブレンドを最適化する,双方向最適化フレームワークであるAutoBalanceを提案する。
具体的には、下位の問題はモデル重みを訓練し、上位の問題は検証データ上で所望の目標を監視し最適化することで損失関数をチューニングする。
損失設計はパラメトリッククロスエントロピー損失と個別化データ拡張スキームを用いてクラス/グループをパーソナライズした処理を可能にする。
不均衡な分類とグループ敏感な分類の応用シナリオに対するアプローチの利点と性能を評価する。
大規模な実証評価は、最先端アプローチに対するAutoBalanceのメリットを示している。
実験結果は,損失関数設計と列車評価分割の利点に関する理論的知見を補足した。
すべてのコードはオープンソースである。
関連論文リスト
- Fair Bilevel Neural Network (FairBiNN): On Balancing fairness and accuracy via Stackelberg Equilibrium [0.3350491650545292]
バイアスを緩和する現在の方法は、情報損失と精度と公平性のバランスが不十分であることが多い。
本稿では,二段階最適化の原理に基づく新しい手法を提案する。
私たちのディープラーニングベースのアプローチは、正確性と公平性の両方を同時に最適化します。
論文 参考訳(メタデータ) (2024-10-21T18:53:39Z) - Optimizing for ROC Curves on Class-Imbalanced Data by Training over a Family of Loss Functions [3.06506506650274]
重度のクラス不均衡の下で信頼性の高い分類器を訓練することは、コンピュータビジョンにおいて難しい問題である。
近年の研究では、損失関数や最適化方法の変更により、不均衡下でのトレーニングの効果を緩和する手法が提案されている。
単一損失関数ではなく、損失関数の族に対するトレーニングを提案する。
論文 参考訳(メタデータ) (2024-02-08T04:31:21Z) - Simplifying Neural Network Training Under Class Imbalance [77.39968702907817]
実世界のデータセットは、しばしば高いクラス不均衡であり、ディープラーニングモデルのパフォーマンスに悪影響を及ぼす可能性がある。
クラス不均衡下でのニューラルネットワークのトレーニングに関する研究の大部分は、特殊な損失関数、サンプリング技術、または2段階のトレーニング手順に焦点を当てている。
バッチサイズやデータ拡張,ラベルの平滑化といった,標準的なディープラーニングパイプラインの既存のコンポーネントを単にチューニングするだけで,そのような特殊なクラス不均衡な手法を使わずに,最先端のパフォーマンスを達成できることを実証する。
論文 参考訳(メタデータ) (2023-12-05T05:52:44Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - FORML: Learning to Reweight Data for Fairness [2.105564340986074]
メタラーニング(FORML)によるフェアネス最適化リヘアリングについて紹介する。
FORMLは、トレーニングサンプル重量とニューラルネットワークのパラメータを共同最適化することで、公正性の制約と精度のバランスを取る。
また,FORMLは,既存の最先端再重み付け手法に比べて,画像分類タスクで約1%,顔予測タスクで約5%向上することを示した。
論文 参考訳(メタデータ) (2022-02-03T17:36:07Z) - AutoLoss: Automated Loss Function Search in Recommendations [34.27873944762912]
候補集合から適切な損失関数を自動かつ適応的に検索できるAutoLossフレームワークを提案する。
既存のアルゴリズムとは異なり、提案したコントローラは、様々な収束挙動に応じて、異なるデータ例に対する損失確率を適応的に生成することができる。
論文 参考訳(メタデータ) (2021-06-12T08:15:00Z) - Fed-Focal Loss for imbalanced data classification in Federated Learning [2.2172881631608456]
Federated Learningには、デバイスネットワーク上のモデルのトレーニングをコーディネートする中央サーバがある。
課題の1つは、データセットがクラス不均衡である場合の可変トレーニングパフォーマンスである。
焦点損失の線に沿って、適切に分類された例に割り当てられた損失を下げるように、クロスエントロピー損失を変形させることにより、クラス不均衡に対処することを提案する。
論文 参考訳(メタデータ) (2020-11-12T09:52:14Z) - Fairness Constraints in Semi-supervised Learning [56.48626493765908]
我々は,最適化問題として定式化された,公平な半教師付き学習のためのフレームワークを開発する。
偏り・分散・雑音分解による半教師あり学習における識別源を理論的に分析する。
本手法は, 公平な半教師付き学習を達成でき, 公正な教師付き学習よりも精度と公平性のトレードオフが良好である。
論文 参考訳(メタデータ) (2020-09-14T04:25:59Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。