論文の概要: Learning Muti-expert Distribution Calibration for Long-tailed Video
Classification
- arxiv url: http://arxiv.org/abs/2205.10788v1
- Date: Sun, 22 May 2022 09:52:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 18:14:52.839580
- Title: Learning Muti-expert Distribution Calibration for Long-tailed Video
Classification
- Title(参考訳): 長期ビデオ分類のためのマルチエキスパート分布校正の学習
- Authors: Yufan Hu, Junyu Gao, Changsheng Xu
- Abstract要約: 2レベル分布情報に基づくエンドツーエンドのマルチエキスパート分布校正手法を提案する。
この2段階の分布情報をモデル化することで、モデルはヘッドクラスとテールクラスを考慮できる。
本手法は,長編ビデオ分類作業における最先端性能を実現する。
- 参考スコア(独自算出の注目度): 88.12433458277168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing state-of-the-art video classification methods assume the
training data obey a uniform distribution. However, video data in the real
world typically exhibit long-tail class distribution and imbalance, which
extensively results in a model bias towards head class and leads to relatively
low performance on tail class. While the current long-tail classification
methods usually focus on image classification, adapting it to video data is not
a trivial extension. We propose an end-to-end multi-experts distribution
calibration method based on two-level distribution information to address these
challenges. The method jointly considers the distribution of samples in each
class (intra-class distribution) and the diverse distributions of overall data
(inter-class distribution) to solve the problem of imbalanced data under
long-tailed distribution. By modeling this two-level distribution information,
the model can consider the head classes and the tail classes and significantly
transfer the knowledge from the head classes to improve the performance of the
tail classes. Extensive experiments verify that our method achieves
state-of-the-art performance on the long-tailed video classification task.
- Abstract(参考訳): 既存の最先端ビデオ分類手法の多くは、トレーニングデータが一様分布に従うと仮定している。
しかし、実世界のビデオデータは典型的にはロングテール級の分布と不均衡を示し、これはヘッドクラスのモデルバイアスをもたらし、テール級の性能は比較的低い。
現在のロングテール分類法は画像分類に焦点を当てているが、ビデオデータへの適応は簡単な拡張ではない。
これらの課題に対処するために,両レベル分布情報に基づくエンドツーエンドのマルチエキスパート分布校正手法を提案する。
本手法では,各クラスにおけるサンプル分布(イントラクラス分布)と全データ分布(クラス間分布)を共同で考慮し,ロングテール分布における不均衡データの問題を解く。
この2レベル分布情報をモデル化することにより、モデルがヘッドクラスとテールクラスを考慮し、ヘッドクラスから知識を著しく転送し、テールクラスの性能を向上させることができる。
広範囲な実験により,長編ビデオ分類作業における最先端性能が得られた。
関連論文リスト
- Adjusting Logit in Gaussian Form for Long-Tailed Visual Recognition [37.62659619941791]
特徴レベルの観点から、長い尾の視覚認識の問題について検討する。
2つの新しいロジット調整法が提案され,計算オーバーヘッドの緩やかなモデル性能が向上した。
ベンチマークデータセットを用いて行った実験は,提案手法の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-18T02:06:06Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Transfer Knowledge from Head to Tail: Uncertainty Calibration under
Long-tailed Distribution [24.734851889816206]
現在の校正技術は、異なるクラスを均等に扱い、暗黙的にトレーニングデータの分布が均衡していると仮定している。
テールクラスのサンプルの重みを推定し,知識伝達に基づくキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2023-04-13T13:48:18Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Label-Aware Distribution Calibration for Long-tailed Classification [25.588323749920324]
末尾クラスの分布を校正するためのラベル認識型LADC手法を提案する。
画像とテキストの長い尾のデータセットの実験は、LADCが既存の手法よりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2021-11-09T01:38:35Z) - Improving Tail-Class Representation with Centroid Contrastive Learning [145.73991900239017]
本稿では,長い尾を持つ表現学習を改善するために,補間型セントロイドコントラスト学習(ICCL)を提案する。
ICCLは、クラス別サンプルとクラス別サンプルの2つの画像を補間し、ICCLの表現が両方のソースクラスのセントロイドを取得するために使用されるようにモデルを訓練する。
我々の結果は、現実世界の長い尾の分布を持つiNaturalist 2018データセットで2.8%の精度向上を示した。
論文 参考訳(メタデータ) (2021-10-19T15:24:48Z) - Long-tailed Recognition by Routing Diverse Distribution-Aware Experts [64.71102030006422]
我々は、RoutIng Diverse Experts (RIDE) と呼ばれる新しい長い尾の分類器を提案する。
複数の専門家とのモデルの分散を減らし、分布を考慮した多様性損失によるモデルバイアスを減らし、動的専門家ルーティングモジュールによる計算コストを削減します。
RIDEは、CIFAR100-LT、ImageNet-LT、iNaturalist 2018ベンチマークで最先端を5%から7%上回っている。
論文 参考訳(メタデータ) (2020-10-05T06:53:44Z) - Rethinking Class-Balanced Methods for Long-Tailed Visual Recognition
from a Domain Adaptation Perspective [98.70226503904402]
現実世界のオブジェクトの周波数は、しばしば電力法則に従い、長い尾のクラス分布を持つデータセット間のミスマッチを引き起こす。
メタラーニング手法を用いて,クラス条件分布の違いを明示的に推定し,古典的なクラスバランス学習を強化することを提案する。
論文 参考訳(メタデータ) (2020-03-24T11:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。