論文の概要: Feature Fusion from Head to Tail for Long-Tailed Visual Recognition
- arxiv url: http://arxiv.org/abs/2306.06963v3
- Date: Mon, 18 Dec 2023 14:39:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 20:43:14.626907
- Title: Feature Fusion from Head to Tail for Long-Tailed Visual Recognition
- Title(参考訳): 長テール視覚認識のための頭部から尾への特徴融合
- Authors: Mengke Li, Zhikai Hu, Yang Lu, Weichao Lan, Yiu-ming Cheung, Hui Huang
- Abstract要約: テールクラスにおけるセマンティック情報の不十分に起因するバイアスのある決定境界は、認識精度の低下に寄与する重要な要因の1つである。
我々は,H2T(head-to-tail fusion)と呼ばれるヘッドクラスから多様な意味情報を移植することで,テールクラスを増強することを提案する。
理論的解析と実用実験の両方で、H2Tが決定境界に対してより最適化された解に寄与できることが示されている。
- 参考スコア(独自算出の注目度): 39.86973663532936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The imbalanced distribution of long-tailed data presents a considerable
challenge for deep learning models, as it causes them to prioritize the
accurate classification of head classes but largely disregard tail classes. The
biased decision boundary caused by inadequate semantic information in tail
classes is one of the key factors contributing to their low recognition
accuracy. To rectify this issue, we propose to augment tail classes by grafting
the diverse semantic information from head classes, referred to as head-to-tail
fusion (H2T). We replace a portion of feature maps from tail classes with those
belonging to head classes. These fused features substantially enhance the
diversity of tail classes. Both theoretical analysis and practical
experimentation demonstrate that H2T can contribute to a more optimized
solution for the decision boundary. We seamlessly integrate H2T in the
classifier adjustment stage, making it a plug-and-play module. Its simplicity
and ease of implementation allow for smooth integration with existing
long-tailed recognition methods, facilitating a further performance boost.
Extensive experiments on various long-tailed benchmarks demonstrate the
effectiveness of the proposed H2T. The source code is available at
https://github.com/Keke921/H2T.
- Abstract(参考訳): 長い尾を持つデータの不均衡分布は、ヘッドクラスの正確な分類を優先するが、テールクラスのほとんどを無視しているため、ディープラーニングモデルにとって大きな課題となる。
末尾クラスにおける意味情報の不十分に起因するバイアス付き決定境界は、認識精度の低下に寄与する重要な要因の1つである。
この問題を正すため,我々はhead-to-tail fusion (h2t) と呼ばれるヘッドクラスからの多様な意味情報をグラフトすることにより,尾クラスを強化することを提案する。
テールクラスのフィーチャーマップの一部を、ヘッドクラスに属するものに置き換えます。
これらの融合特徴はテールクラスの多様性を大幅に向上させる。
理論的解析と実用実験の両方で、H2Tが決定境界に対してより最適化された解に寄与できることが示されている。
我々はH2Tを分類器調整段階にシームレスに統合し、プラグアンドプレイモジュールとした。
そのシンプルさと実装の容易さにより、既存のロングテール認識手法とのスムーズな統合が可能になり、さらなるパフォーマンス向上が促進される。
様々な長い尾を持つベンチマークに対する大規模な実験は、提案されたH2Tの有効性を示す。
ソースコードはhttps://github.com/keke921/h2t。
関連論文リスト
- Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - LCReg: Long-Tailed Image Classification with Latent Categories based
Recognition [81.5551335554507]
本稿では,Lar-tail Recognition(LCReg)法を提案する。
我々の仮説は、頭と尾のクラスで共有される一般的な潜伏的特徴は、特徴表現を改善するために使用できるというものである。
具体的には、頭と尾の両方で共有されるクラス非依存の潜伏特徴の集合を学習し、潜伏特徴のセマンティックデータ拡張を用いてトレーニングサンプルの多様性を暗黙的に増加させる。
論文 参考訳(メタデータ) (2023-09-13T02:03:17Z) - Dual Compensation Residual Networks for Class Imbalanced Learning [98.35401757647749]
そこで本研究では,尾と頭の両方に適合する2次元補償残差ネットワークを提案する。
オーバーフィッティングを引き起こす重要な要因は、トレーニングとテールクラスのテストデータの間に深刻な特徴ドリフトがあることである。
また,不適合問題を軽減するためにResidual Balanced Multi-Proxies分類器を提案する。
論文 参考訳(メタデータ) (2023-08-25T04:06:30Z) - Head-Tail Cooperative Learning Network for Unbiased Scene Graph
Generation [30.467562472064177]
現在の無バイアスのシーングラフ生成(SGG)手法は、頭部述語予測におけるかなりの犠牲を無視している。
本稿では,頭部優先と尾長優先の特徴表現を含むモデル非依存型頭位協調学習ネットワークを提案する。
提案手法は,リコールにおいて最小限の犠牲を伴って高い平均リコールを実現し,新しい最先端の総合性能を実現する。
論文 参考訳(メタデータ) (2023-08-23T10:29:25Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Dual-branch Hybrid Learning Network for Unbiased Scene Graph Generation [87.13847750383778]
シーングラフ生成のための頭部述語と尾部述語の両方を扱うDual-branch Hybrid Learning Network (DHL)を提案する。
提案手法は,VGおよびGQAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-16T11:53:50Z) - Deep Representation Learning on Long-tailed Data: A Learnable Embedding
Augmentation Perspective [17.602607883721973]
深い特徴空間では、ヘッドクラスとテールクラスは異なる分布パターンを示す。
それぞれの機能を"機能クラウド"に構成することを提案する。
それぞれの尾のサンプルは、他のクラスのサンプルを遠くから押し出すことができ、尾のクラスのクラス内での多様性を回復する。
論文 参考訳(メタデータ) (2020-02-25T12:38:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。