論文の概要: Reviving Undersampling for Long-Tailed Learning
- arxiv url: http://arxiv.org/abs/2401.16811v1
- Date: Tue, 30 Jan 2024 08:15:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 15:42:33.385201
- Title: Reviving Undersampling for Long-Tailed Learning
- Title(参考訳): ロングテール学習のためのリバイバルアンサンプ
- Authors: Hao Yu, Yingxiao Du, Jianxin Wu
- Abstract要約: 我々は,最低性能カテゴリーの精度を高め,調和平均と幾何平均を用いてモデルの性能を評価することを目的とする。
我々は,余分なオーバーヘッドを伴わず,高調波平均と幾何平均を改良したモデルアンサンブル戦略を考案した。
提案手法の有効性を,長期学習のための広く利用されているベンチマークデータセットに検証する。
- 参考スコア(独自算出の注目度): 16.054442161144603
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The training datasets used in long-tailed recognition are extremely
unbalanced, resulting in significant variation in per-class accuracy across
categories. Prior works mostly used average accuracy to evaluate their
algorithms, which easily ignores those worst-performing categories. In this
paper, we aim to enhance the accuracy of the worst-performing categories and
utilize the harmonic mean and geometric mean to assess the model's performance.
We revive the balanced undersampling idea to achieve this goal. In few-shot
learning, balanced subsets are few-shot and will surely under-fit, hence it is
not used in modern long-tailed learning. But, we find that it produces a more
equitable distribution of accuracy across categories with much higher harmonic
and geometric mean accuracy, and, but lower average accuracy. Moreover, we
devise a straightforward model ensemble strategy, which does not result in any
additional overhead and achieves improved harmonic and geometric mean while
keeping the average accuracy almost intact when compared to state-of-the-art
long-tailed learning methods. We validate the effectiveness of our approach on
widely utilized benchmark datasets for long-tailed learning. Our code is at
\href{https://github.com/yuhao318/BTM/}{https://github.com/yuhao318/BTM/}.
- Abstract(参考訳): ロングテール認識で使用されるトレーニングデータセットは非常に不均衡であり、クラス毎の精度がカテゴリによって大きく異なる。
これまでの作業では、アルゴリズムの評価に平均精度が使われていました。
本稿では,最もパフォーマンスの悪いカテゴリの精度を高め,高調波平均と幾何平均を用いてモデルの性能を評価することを目的とする。
私たちはこの目標を達成するためにバランスのとれたアンサンブルのアイデアを復活させます。
少数ショット学習では、バランスの取れた部分集合は少数ショットであり、確実に不適合であるため、現代のロングテール学習では使われない。
しかし、高調波平均精度と幾何平均精度がより高く、平均精度がより低いカテゴリ間で、より公平な精度分布を生成することが判明した。
さらに,従来のロングテール学習法と比較して,平均精度をほぼ一定に保ちつつ,余分なオーバーヘッドを伴わず,高調波平均と幾何平均を改良したモデルアンサンブル戦略を考案した。
提案手法の有効性を,長期学習のための広く利用されているベンチマークデータセットに検証する。
私たちのコードは \href{https://github.com/yuhao318/BTM/}{https://github.com/yuhao318/BTM/} にあります。
関連論文リスト
- Achieving More with Less: A Tensor-Optimization-Powered Ensemble Method [53.170053108447455]
アンサンブル学習(英: Ensemble learning)は、弱い学習者を利用して強力な学習者を生み出す方法である。
我々は、マージンの概念を活かした滑らかで凸な目的関数を設計し、強力な学習者がより差別的になるようにした。
そして、我々のアルゴリズムを、多数のデータセットの10倍の大きさのランダムな森林や他の古典的な手法と比較する。
論文 参考訳(メタデータ) (2024-08-06T03:42:38Z) - Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。
本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。
そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-12-07T18:37:43Z) - Unsupervised Estimation of Ensemble Accuracy [0.0]
いくつかの分類器の結合力を推定する手法を提案する。
ラベルに依存しない「多様性」対策に重点を置く既存のアプローチとは異なる。
本手法は,一般的な大規模顔認証データセット上で実証する。
論文 参考訳(メタデータ) (2023-11-18T02:31:36Z) - No One Left Behind: Improving the Worst Categories in Long-Tailed
Learning [29.89394406438639]
このような評価設定の下では、いくつかのカテゴリは必然的に犠牲にされます。
多様な手法に適用可能な簡易なプラグイン法を提案する。
論文 参考訳(メタデータ) (2023-03-07T03:24:54Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Worst Case Matters for Few-Shot Recognition [27.023352955311502]
少ないショット認識は、カテゴリ毎に非常に少ない(例:1または5)画像を持つ認識モデルを学ぶ。
現在の数発の学習方法は、多くのエピソードの平均精度を改善することに焦点を当てている。
現実のアプリケーションでは、多くではなく1回だけ試すことがよくあるので、最悪のケースの精度を最大化することは、平均的な精度を最大化することよりも重要である、と私たちは主張する。
論文 参考訳(メタデータ) (2022-03-13T05:39:40Z) - Learning Optimal Fair Classification Trees: Trade-offs Between
Interpretability, Fairness, and Accuracy [7.215903549622416]
最適分類木を学習するための混合整数最適化フレームワークを提案する。
我々は、一般的なデータセットの公平な分類のための最先端アプローチに対して、我々の手法をベンチマークする。
我々の手法は、ほぼ完全に一致した決定を一貫して見つけ出すが、他の手法は滅多にない。
論文 参考訳(メタデータ) (2022-01-24T19:47:10Z) - Newer is not always better: Rethinking transferability metrics, their
peculiarities, stability and performance [5.650647159993238]
小さなカスタマイズされたデータセット上で、大規模で事前訓練された画像と言語モデルの微調整が人気を集めている。
共分散推定における統計的問題により,Hスコアの性能が低下することが示唆された。
そこで我々は,そのような設定における相対的精度に対する相関性能を補正し,評価することを推奨する。
論文 参考訳(メタデータ) (2021-10-13T17:24:12Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。