論文の概要: Solution for Large-scale Long-tailed Recognition with Noisy Labels
- arxiv url: http://arxiv.org/abs/2106.10683v1
- Date: Sun, 20 Jun 2021 12:09:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:58:27.219684
- Title: Solution for Large-scale Long-tailed Recognition with Noisy Labels
- Title(参考訳): 雑音ラベルを用いた大規模ロングテール認識の解法
- Authors: Yuqiao Xian, Jia-Xin Zhuang, Fufu Yu
- Abstract要約: AliProducts Challengeは、大規模できめ細かいコモディティ画像認識問題を研究するためのコンペティションである。
我々は、ResNeSt、EfficientNetV2、DeiTを含むCNNとTransformerの最先端モデルアーキテクチャを採用する。
スコアボードにおける平均クラスエラー率6.4365%をアンサンブルモデルで取得する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This is a technical report for CVPR 2021 AliProducts Challenge. AliProducts
Challenge is a competition proposed for studying the large-scale and
fine-grained commodity image recognition problem encountered by worldleading
ecommerce companies. The large-scale product recognition simultaneously meets
the challenge of noisy annotations, imbalanced (long-tailed) data distribution
and fine-grained classification. In our solution, we adopt stateof-the-art
model architectures of both CNNs and Transformer, including ResNeSt,
EfficientNetV2, and DeiT. We found that iterative data cleaning, classifier
weight normalization, high-resolution finetuning, and test time augmentation
are key components to improve the performance of training with the noisy and
imbalanced dataset. Finally, we obtain 6.4365% mean class error rate in the
leaderboard with our ensemble model.
- Abstract(参考訳): これはCVPR 2021 AliProducts Challengeの技術的レポートである。
AliProducts Challenge(アリプロダクツチャレンジ)は、世界展開するeコマース企業が直面する大規模かつきめ細かい商品画像認識問題を研究するために提案されるコンテストである。
大規模な製品認識は、ノイズの多いアノテーション、不均衡な(長い尾の)データ分布、きめ細かい分類といった課題を同時に満たす。
我々のソリューションでは、ResNeSt、EfficientNetV2、DeiTを含むCNNとTransformerの最先端モデルアーキテクチャを採用しています。
その結果,反復的データクリーニング,分類器重み正規化,高分解能微調整,テスト時間拡張が,ノイズと不均衡なデータセットによるトレーニング性能向上の鍵となることがわかった。
最後に,アンサンブルモデルを用いてリーダボードに6.4365%の平均クラスエラー率を求める。
関連論文リスト
- Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network [4.8748194765816955]
本研究では、自己エンコーダに基づくデータ拡張技術と畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。
提案手法は,ランダムフォレスト,SVM,ロジスティック回帰をそれぞれ19%,21%,27%以上,98.56%の分類精度を達成している。
論文 参考訳(メタデータ) (2024-11-17T10:19:54Z) - Conformal-in-the-Loop for Learning with Imbalanced Noisy Data [5.69777817429044]
大規模なデータセットでは、クラス不均衡とラベルノイズが広まっています。
機械学習の研究の多くは、よくラベル付けされたバランスの取れたデータを前提としている。
コンフォーマル・イン・ザ・ループ(Conformal-in-the-Loop, CitL)は,コンフォーマルな予測に基づく手法を用いて,両課題に対処する新しいトレーニングフレームワークである。
論文 参考訳(メタデータ) (2024-11-04T17:09:58Z) - An Embedding is Worth a Thousand Noisy Labels [0.11999555634662634]
本稿では,重み付けされたアダプティブNearest Neighborアプローチを用いてラベルノイズに対処するWANNを提案する。
WANNの参照手法は、様々な大きさの多様なデータセットや、様々なノイズタイプや重大さで優れていることを示す。
私たちのアプローチは、効率性と説明可能性を強調し、ディープニューラルネットワークトレーニングの固有の制限を克服するための、シンプルで堅牢なソリューションとして現れます。
論文 参考訳(メタデータ) (2024-08-26T15:32:31Z) - CEKD:Cross Ensemble Knowledge Distillation for Augmented Fine-grained
Data [7.012047150376948]
提案モデルはエンドツーエンドでトレーニング可能であり,イメージレベルのラベル管理のみを必要とする。
ResNet-101のバックボーンにより、CEKDは3つのデータセットでそれぞれ89.59%、95.96%、94.56%の精度を得る。
論文 参考訳(メタデータ) (2022-03-13T02:57:25Z) - High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。
提案手法は画像分割精細化において高速かつ効果的である。
論文 参考訳(メタデータ) (2021-11-29T11:53:06Z) - Investigating Tradeoffs in Real-World Video Super-Resolution [90.81396836308085]
実世界のビデオ超解像(VSR)モデルは、一般化性を改善するために様々な劣化で訓練されることが多い。
最初のトレードオフを軽減するために,性能を犠牲にすることなく,最大40%のトレーニング時間を削減できる劣化手法を提案する。
そこで本研究では,多種多様な実世界の低品質映像系列を含むビデオLQデータセットを提案する。
論文 参考訳(メタデータ) (2021-11-24T18:58:21Z) - Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。
実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文 参考訳(メタデータ) (2021-06-14T17:39:49Z) - Learning to Perturb Word Embeddings for Out-of-distribution QA [55.103586220757464]
本論文では,入力問題と文脈の単語埋め込みを意味論を変化させることなく学習するノイズ発生器に基づく簡便かつ効果的なDA法を提案する。
ひとつのソースデータセットに,5つの異なるターゲットドメインに埋め込むことで,トレーニングされたQAモデルのパフォーマンスを検証する。
特に、私たちのトレーニングを受けたモデルは、240K以上の人工的なQAペアでトレーニングされたモデルよりも優れています。
論文 参考訳(メタデータ) (2021-05-06T14:12:26Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。