Fugu-MT 論文翻訳(概要): Solution for Large-scale Long-tailed Recognition with Noisy Labels

論文の概要: Solution for Large-scale Long-tailed Recognition with Noisy Labels

arxiv url: http://arxiv.org/abs/2106.10683v1
Date: Sun, 20 Jun 2021 12:09:38 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-22 15:58:27.219684
Title: Solution for Large-scale Long-tailed Recognition with Noisy Labels
Title（参考訳）: 雑音ラベルを用いた大規模ロングテール認識の解法
Authors: Yuqiao Xian, Jia-Xin Zhuang, Fufu Yu
Abstract要約: AliProducts Challengeは、大規模できめ細かいコモディティ画像認識問題を研究するためのコンペティションである。我々は、ResNeSt、EfficientNetV2、DeiTを含むCNNとTransformerの最先端モデルアーキテクチャを採用する。スコアボードにおける平均クラスエラー率6.4365%をアンサンブルモデルで取得する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This is a technical report for CVPR 2021 AliProducts Challenge. AliProducts Challenge is a competition proposed for studying the large-scale and fine-grained commodity image recognition problem encountered by worldleading ecommerce companies. The large-scale product recognition simultaneously meets the challenge of noisy annotations, imbalanced (long-tailed) data distribution and fine-grained classification. In our solution, we adopt stateof-the-art model architectures of both CNNs and Transformer, including ResNeSt, EfficientNetV2, and DeiT. We found that iterative data cleaning, classifier weight normalization, high-resolution finetuning, and test time augmentation are key components to improve the performance of training with the noisy and imbalanced dataset. Finally, we obtain 6.4365% mean class error rate in the leaderboard with our ensemble model.
Abstract（参考訳）: これはCVPR 2021 AliProducts Challengeの技術的レポートである。 AliProducts Challenge(アリプロダクツチャレンジ)は、世界展開するeコマース企業が直面する大規模かつきめ細かい商品画像認識問題を研究するために提案されるコンテストである。大規模な製品認識は、ノイズの多いアノテーション、不均衡な(長い尾の)データ分布、きめ細かい分類といった課題を同時に満たす。我々のソリューションでは、ResNeSt、EfficientNetV2、DeiTを含むCNNとTransformerの最先端モデルアーキテクチャを採用しています。その結果,反復的データクリーニング,分類器重み正規化,高分解能微調整,テスト時間拡張が,ノイズと不均衡なデータセットによるトレーニング性能向上の鍵となることがわかった。最後に,アンサンブルモデルを用いてリーダボードに6.4365%の平均クラスエラー率を求める。

関連論文リスト

Exploring "Many in Few" and "Few in Many" Properties in Long-Tailed, Highly-Imbalanced IC Defect Classification [28.634908806910676]
本稿では,AOIシステムから得られた大規模かつ不均衡なIC欠陥画像データセットであるIC-Defect-14について紹介する。このデータセットは、大きなクラス内多様性と高いクラス間類似性という2つの大きな課題を示す、独自の"イントラクラスクラスタ"特性によって特徴づけられる。本稿では,マルチエキスパートフレームワークを踏襲したReCAME-Netを提案し,地域チャネルアテンションモジュール,メトリック学習損失,ハードカテゴリマイニング戦略,知識蒸留手法を統合する。
論文参考訳（メタデータ） (2025-10-22T10:50:27Z)
Dual-granularity Sinkhorn Distillation for Enhanced Learning from Long-tailed Noisy Data [67.25796812343454]
ディープラーニングのための実世界のデータセットは、クラス不均衡とラベルノイズの共起的な課題にしばしば悩まされる。蒸留と相補的な知見の統合により二重強靭性を高める新しいフレームワークであるD-SINKを提案する。ベンチマークデータセットの実験では、D-SINKはロバスト性を大幅に向上し、長い尾のノイズデータから学習する際の強い経験的性能を達成することが示された。
論文参考訳（メタデータ） (2025-10-09T13:05:27Z)
VQualA 2025 Challenge on Image Super-Resolution Generated Content Quality Assessment: Methods and Results [65.82676254264837]
本稿では,画像超解像生成コンテンツ品質評価データセットに基づく ISRGC-Q Challenge を提案する。この課題の第一の目的は、現代の超解像技術によって導入されたユニークな人工物を分析し、知覚的品質を効果的に評価することである。
論文参考訳（メタデータ） (2025-09-08T08:07:50Z)
Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network [4.8748194765816955]
本研究では、自己エンコーダに基づくデータ拡張技術と畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。提案手法は,ランダムフォレスト,SVM,ロジスティック回帰をそれぞれ19%,21%,27%以上,98.56%の分類精度を達成している。
論文参考訳（メタデータ） (2024-11-17T10:19:54Z)
Conformal-in-the-Loop for Learning with Imbalanced Noisy Data [5.69777817429044]
大規模なデータセットでは、クラス不均衡とラベルノイズが広まっています。機械学習の研究の多くは、よくラベル付けされたバランスの取れたデータを前提としている。コンフォーマル・イン・ザ・ループ(Conformal-in-the-Loop, CitL)は,コンフォーマルな予測に基づく手法を用いて,両課題に対処する新しいトレーニングフレームワークである。
論文参考訳（メタデータ） (2024-11-04T17:09:58Z)
An Embedding is Worth a Thousand Noisy Labels [0.11999555634662634]
本稿では,重み付けされたアダプティブNearest Neighborアプローチを用いてラベルノイズに対処するWANNを提案する。 WANNの参照手法は、様々な大きさの多様なデータセットや、様々なノイズタイプや重大さで優れていることを示す。私たちのアプローチは、効率性と説明可能性を強調し、ディープニューラルネットワークトレーニングの固有の制限を克服するための、シンプルで堅牢なソリューションとして現れます。
論文参考訳（メタデータ） (2024-08-26T15:32:31Z)
Inverse Image Frequency for Long-tailed Image Recognition [59.40098825416675]
Inverse Image Frequency (IIF) と呼ばれる新しいデバイアス法を提案する。 IIFは畳み込みニューラルネットワークの分類層におけるロジットの乗法的マージン調整変換である。我々の実験では、IIFは長い尾のベンチマークにおいて、最先端の技術を超越していることが示されている。
論文参考訳（メタデータ） (2022-09-11T13:31:43Z)
2nd Place Solution for ICCV 2021 VIPriors Image Classification Challenge: An Attract-and-Repulse Learning Approach [41.346232387426944]
畳み込みニューラルネットワーク(CNN)は、大規模なデータセットを利用することで、画像分類において大きな成功を収めた。特徴表現を豊かにするContrastive Regularization(CR)と、異なるクラスに対する適合性のバランスをとるSymmetric Cross Entropy(SCE)からなるAttract-and-Repulseを提案する。具体的には、SCEとCRは、クラス(トラクション)とインスタンス(リパルス)の情報間の適応的トレードオフによる過度な適合を緩和しながら、識別表現を学習する。
論文参考訳（メタデータ） (2022-06-13T13:54:33Z)
CEKD:Cross Ensemble Knowledge Distillation for Augmented Fine-grained Data [7.012047150376948]
提案モデルはエンドツーエンドでトレーニング可能であり,イメージレベルのラベル管理のみを必要とする。 ResNet-101のバックボーンにより、CEKDは3つのデータセットでそれぞれ89.59%、95.96%、94.56%の精度を得る。
論文参考訳（メタデータ） (2022-03-13T02:57:25Z)
High Quality Segmentation for Ultra High-resolution Images [72.97958314291648]
超高分解能セグメンテーション精錬作業のための連続精細モデルを提案する。提案手法は画像分割精細化において高速かつ効果的である。
論文参考訳（メタデータ） (2021-11-29T11:53:06Z)
Investigating Tradeoffs in Real-World Video Super-Resolution [90.81396836308085]
実世界のビデオ超解像(VSR)モデルは、一般化性を改善するために様々な劣化で訓練されることが多い。最初のトレードオフを軽減するために,性能を犠牲にすることなく,最大40%のトレーニング時間を削減できる劣化手法を提案する。そこで本研究では,多種多様な実世界の低品質映像系列を含むビデオLQデータセットを提案する。
論文参考訳（メタデータ） (2021-11-24T18:58:21Z)
Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文参考訳（メタデータ） (2021-06-14T17:39:49Z)
Learning to Perturb Word Embeddings for Out-of-distribution QA [55.103586220757464]
本論文では,入力問題と文脈の単語埋め込みを意味論を変化させることなく学習するノイズ発生器に基づく簡便かつ効果的なDA法を提案する。ひとつのソースデータセットに,5つの異なるターゲットドメインに埋め込むことで,トレーニングされたQAモデルのパフォーマンスを検証する。特に、私たちのトレーニングを受けたモデルは、240K以上の人工的なQAペアでトレーニングされたモデルよりも優れています。
論文参考訳（メタデータ） (2021-05-06T14:12:26Z)
Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。半教師付き長尾認識という新しい認識設定を提案する。 2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文参考訳（メタデータ） (2021-05-01T00:43:38Z)
Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文参考訳（メタデータ） (2020-04-07T20:57:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。