論文の概要: Beyond Synthetic Augmentation: Group-Aware Threshold Calibration for Robust Balanced Accuracy in Imbalanced Learning
- arxiv url: http://arxiv.org/abs/2509.02592v1
- Date: Fri, 29 Aug 2025 05:57:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.234788
- Title: Beyond Synthetic Augmentation: Group-Aware Threshold Calibration for Robust Balanced Accuracy in Imbalanced Learning
- Title(参考訳): 合成強化を超えて:不均衡学習におけるロバストバランスの正確性に対するグループ認識閾値校正
- Authors: Hunter Gittlin,
- Abstract要約: クラス不均衡は、機械学習における根本的な課題である。
グループ対応のしきい値キャリブレーションにより、クラス不均衡に対するよりシンプルで、より解釈可能で、より効果的な解が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Class imbalance remains a fundamental challenge in machine learning, with traditional solutions often creating as many problems as they solve. We demonstrate that group-aware threshold calibration--setting different decision thresholds for different demographic groups--provides superior robustness compared to synthetic data generation methods. Through extensive experiments, we show that group-specific thresholds achieve 1.5-4% higher balanced accuracy than SMOTE and CT-GAN augmented models while improving worst-group balanced accuracy. Unlike single-threshold approaches that apply one cutoff across all groups, our group-aware method optimizes the Pareto frontier between balanced accuracy and worst-group balanced accuracy, enabling fine-grained control over group-level performance. Critically, we find that applying group thresholds to synthetically augmented data yields minimal additional benefit, suggesting these approaches are fundamentally redundant. Our results span seven model families including linear, tree-based, instance-based, and boosting methods, confirming that group-aware threshold calibration offers a simpler, more interpretable, and more effective solution to class imbalance.
- Abstract(参考訳): クラス不均衡は、機械学習における根本的な課題であり、従来のソリューションは、解決できる限り多くの問題を生み出すことが多い。
集団認識しきい値のキャリブレーション – 異なる人口集団に対して異なる決定しきい値を設定する – は、合成データ生成法と比較して、優れたロバスト性を示す。
実験により,SMOTEとCT-GANの併用モデルよりも,グループ別閾値が1.5~4%高い精度を実現し,最悪のグループ間バランス精度が向上した。
全てのグループに1つのカットオフを適用するシングルスレッドアプローチとは異なり、グループ認識方式は、バランスの取れた精度と最悪のグループのバランスの取れた精度の間のパレートフロンティアを最適化し、グループレベルのパフォーマンスをきめ細かな制御を可能にする。
批判的に、グループ閾値を合成的に拡張したデータに適用すると、最小限の付加的な利益が得られることが分かり、これらのアプローチは基本的に冗長であることを示す。
その結果、線形、ツリーベース、インスタンスベース、ブースティングメソッドを含む7つのモデルファミリーにまたがって、グループ対応のしきい値キャリブレーションにより、クラス不均衡に対するよりシンプルで、より解釈可能で、より効果的な解が得られることを確認した。
関連論文リスト
- Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [61.45587642780908]
画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。
本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。
我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文 参考訳(メタデータ) (2025-03-12T15:46:12Z) - The Group Robustness is in the Details: Revisiting Finetuning under Spurious Correlations [8.844894807922902]
現代の機械学習モデルは、素早い相関に過度に依存する傾向がある。
本稿では,最短群精度における微調整モデルの意外かつニュアンスな挙動を同定する。
以上の結果より,群強靭性を有する現代ファインチュードモデルの微妙な相互作用が以前よりも顕著に示された。
論文 参考訳(メタデータ) (2024-07-19T00:34:03Z) - How does promoting the minority fraction affect generalization? A theoretical study of the one-hidden-layer neural network on group imbalance [64.1656365676171]
グループ不均衡は経験的リスク最小化において既知の問題である。
本稿では,個々の集団がサンプルの複雑さ,収束率,平均および群レベルの試験性能に与える影響を定量化する。
論文 参考訳(メタデータ) (2024-03-12T04:38:05Z) - Bias Amplification Enhances Minority Group Performance [10.380812738348899]
本稿では,新しい2段階学習アルゴリズムであるBAMを提案する。
第1段階では、各トレーニングサンプルに対して学習可能な補助変数を導入することにより、バイアス増幅方式を用いてモデルを訓練する。
第2段階では、バイアス増幅モデルが誤分類したサンプルを重み付けし、その後、再重み付けされたデータセット上で同じモデルをトレーニングし続けます。
論文 参考訳(メタデータ) (2023-09-13T04:40:08Z) - Correct-N-Contrast: A Contrastive Approach for Improving Robustness to Spurious Correlations [89.86495158918615]
豪華な相関関係は、堅牢な機械学習にとって大きな課題となる。
経験的リスク最小化(ERM)で訓練されたモデルは、クラスラベルとスプリアス属性の相関に依存することを学習することができる。
CNC(Correct-N-Contrast, Correct-N-Contrast)を提案する。
論文 参考訳(メタデータ) (2022-03-03T05:03:28Z) - Simple data balancing achieves competitive worst-group-accuracy [16.197105634385693]
我々は、最先端の手法とクラスとグループの単純なバランスを比較し、データをサブサンプリングまたは再重み付けする。
以上の結果から,これらのデータバランシングベースラインが精度の高い状態を実現することが示唆された。
グループ情報へのアクセスは、モデル選択の目的にとって最も重要であり、トレーニング中はあまり重要ではない。
論文 参考訳(メタデータ) (2021-10-27T15:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。