論文の概要: Solution for Large-scale Long-tailed Recognition with Noisy Labels
- arxiv url: http://arxiv.org/abs/2106.10683v1
- Date: Sun, 20 Jun 2021 12:09:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:58:27.219684
- Title: Solution for Large-scale Long-tailed Recognition with Noisy Labels
- Title(参考訳): 雑音ラベルを用いた大規模ロングテール認識の解法
- Authors: Yuqiao Xian, Jia-Xin Zhuang, Fufu Yu
- Abstract要約: AliProducts Challengeは、大規模できめ細かいコモディティ画像認識問題を研究するためのコンペティションである。
我々は、ResNeSt、EfficientNetV2、DeiTを含むCNNとTransformerの最先端モデルアーキテクチャを採用する。
スコアボードにおける平均クラスエラー率6.4365%をアンサンブルモデルで取得する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This is a technical report for CVPR 2021 AliProducts Challenge. AliProducts
Challenge is a competition proposed for studying the large-scale and
fine-grained commodity image recognition problem encountered by worldleading
ecommerce companies. The large-scale product recognition simultaneously meets
the challenge of noisy annotations, imbalanced (long-tailed) data distribution
and fine-grained classification. In our solution, we adopt stateof-the-art
model architectures of both CNNs and Transformer, including ResNeSt,
EfficientNetV2, and DeiT. We found that iterative data cleaning, classifier
weight normalization, high-resolution finetuning, and test time augmentation
are key components to improve the performance of training with the noisy and
imbalanced dataset. Finally, we obtain 6.4365% mean class error rate in the
leaderboard with our ensemble model.
- Abstract(参考訳): これはCVPR 2021 AliProducts Challengeの技術的レポートである。
AliProducts Challenge(アリプロダクツチャレンジ)は、世界展開するeコマース企業が直面する大規模かつきめ細かい商品画像認識問題を研究するために提案されるコンテストである。
大規模な製品認識は、ノイズの多いアノテーション、不均衡な(長い尾の)データ分布、きめ細かい分類といった課題を同時に満たす。
我々のソリューションでは、ResNeSt、EfficientNetV2、DeiTを含むCNNとTransformerの最先端モデルアーキテクチャを採用しています。
その結果,反復的データクリーニング,分類器重み正規化,高分解能微調整,テスト時間拡張が,ノイズと不均衡なデータセットによるトレーニング性能向上の鍵となることがわかった。
最後に,アンサンブルモデルを用いてリーダボードに6.4365%の平均クラスエラー率を求める。
関連論文リスト
- Incorporating Crowdsourced Annotator Distributions into Ensemble
Modeling to Improve Classification Trustworthiness for Ancient Greek Papyri [3.870354915766567]
このようなデータセットの問題を複雑にする2つの問題は、クラス不均衡とラベリングにおける地道不確実性である。
このようなデータセットに対するアンサンブルモデリングの応用は、地上の真実が疑問視されている画像を特定し、それらのサンプルの信頼性を定量化するのに役立ちます。
論文 参考訳(メタデータ) (2022-10-28T19:39:14Z) - 2nd Place Solution for ICCV 2021 VIPriors Image Classification
Challenge: An Attract-and-Repulse Learning Approach [41.346232387426944]
畳み込みニューラルネットワーク(CNN)は、大規模なデータセットを利用することで、画像分類において大きな成功を収めた。
特徴表現を豊かにするContrastive Regularization(CR)と、異なるクラスに対する適合性のバランスをとるSymmetric Cross Entropy(SCE)からなるAttract-and-Repulseを提案する。
具体的には、SCEとCRは、クラス(トラクション)とインスタンス(リパルス)の情報間の適応的トレードオフによる過度な適合を緩和しながら、識別表現を学習する。
論文 参考訳(メタデータ) (2022-06-13T13:54:33Z) - CEKD:Cross Ensemble Knowledge Distillation for Augmented Fine-grained
Data [7.012047150376948]
提案モデルはエンドツーエンドでトレーニング可能であり,イメージレベルのラベル管理のみを必要とする。
ResNet-101のバックボーンにより、CEKDは3つのデータセットでそれぞれ89.59%、95.96%、94.56%の精度を得る。
論文 参考訳(メタデータ) (2022-03-13T02:57:25Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Investigating Tradeoffs in Real-World Video Super-Resolution [90.81396836308085]
実世界のビデオ超解像(VSR)モデルは、一般化性を改善するために様々な劣化で訓練されることが多い。
最初のトレードオフを軽減するために,性能を犠牲にすることなく,最大40%のトレーニング時間を削減できる劣化手法を提案する。
そこで本研究では,多種多様な実世界の低品質映像系列を含むビデオLQデータセットを提案する。
論文 参考訳(メタデータ) (2021-11-24T18:58:21Z) - Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。
実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文 参考訳(メタデータ) (2021-06-14T17:39:49Z) - Learning to Perturb Word Embeddings for Out-of-distribution QA [55.103586220757464]
本論文では,入力問題と文脈の単語埋め込みを意味論を変化させることなく学習するノイズ発生器に基づく簡便かつ効果的なDA法を提案する。
ひとつのソースデータセットに,5つの異なるターゲットドメインに埋め込むことで,トレーニングされたQAモデルのパフォーマンスを検証する。
特に、私たちのトレーニングを受けたモデルは、240K以上の人工的なQAペアでトレーニングされたモデルよりも優れています。
論文 参考訳(メタデータ) (2021-05-06T14:12:26Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Towards Stable Imbalanced Data Classification via Virtual Big Data
Projection [3.3707422585608953]
深層オートエンコーダ訓練と不均衡データ分類に対処するVBDの能力について検討する。
まず、VBDは、膨大な多様なトレーニングデータを提供することで、オートエンコーダのバリデーション損失を著しく低減できることを示す。
第2に、オーバーサンプリングを伴わないスキュートクラス分布のバランスをとるために、クロスコンカニエーションと呼ばれる最初のプロジェクションベース手法を提案する。
論文 参考訳(メタデータ) (2020-08-23T04:01:51Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。