論文の概要: Weakly Supervised Learning with Side Information for Noisy Labeled
Images
- arxiv url: http://arxiv.org/abs/2008.11586v2
- Date: Fri, 4 Sep 2020 08:02:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 04:09:12.323239
- Title: Weakly Supervised Learning with Side Information for Noisy Labeled
Images
- Title(参考訳): 雑音ラベル画像に対するサイド情報を用いた弱教師付き学習
- Authors: Lele Cheng, Xiangzeng Zhou, Liming Zhao, Dangwei Li, Hong Shang, Yun
Zheng, Pan Pan, Yinghui Xu
- Abstract要約: サイド・インフォメーション・ネットワーク(SINet)を用いた効率的な弱教師付き学習法を提案する。
提案したSINetは、ビジュアルプロトタイプモジュールとノイズ重み付けモジュールで構成されている。
提案されたSINetは、ノイズの多い画像ラベルの負の影響を大幅に軽減することができる。
- 参考スコア(独自算出の注目度): 41.37584960976829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many real-world datasets, like WebVision, the performance of DNN based
classifier is often limited by the noisy labeled data. To tackle this problem,
some image related side information, such as captions and tags, often reveal
underlying relationships across images. In this paper, we present an efficient
weakly supervised learning by using a Side Information Network (SINet), which
aims to effectively carry out a large scale classification with severely noisy
labels. The proposed SINet consists of a visual prototype module and a noise
weighting module. The visual prototype module is designed to generate a compact
representation for each category by introducing the side information. The noise
weighting module aims to estimate the correctness of each noisy image and
produce a confidence score for image ranking during the training procedure. The
propsed SINet can largely alleviate the negative impact of noisy image labels,
and is beneficial to train a high performance CNN based classifier. Besides, we
released a fine-grained product dataset called AliProducts, which contains more
than 2.5 million noisy web images crawled from the internet by using queries
generated from 50,000 fine-grained semantic classes. Extensive experiments on
several popular benchmarks (i.e. Webvision, ImageNet and Clothing-1M) and our
proposed AliProducts achieve state-of-the-art performance. The SINet has won
the first place in the classification task on WebVision Challenge 2019, and
outperformed other competitors by a large margin.
- Abstract(参考訳): WebVisionのような現実世界のデータセットでは、DNNベースの分類器のパフォーマンスは、ノイズの多いラベル付きデータによって制限されることが多い。
この問題に対処するため、キャプションやタグなどの画像関連情報によっては、画像間の基盤となる関係を明らかにすることが多い。
本稿では,重度雑音ラベルを用いた大規模分類を効果的に行うことを目的とした,サイドインフォメーションネットワーク(SINet)を用いた効率的な弱教師付き学習を提案する。
提案するsinetはビジュアルプロトタイプモジュールとノイズ重みモジュールで構成されている。
視覚プロトタイプモジュールは、側情報を導入して各カテゴリのコンパクトな表現を生成するように設計されている。
ノイズ重み付けモジュールは、各ノイズ画像の正しさを推定し、トレーニング中の画像ランキングに対する信頼スコアを生成する。
プロップされたsinetはノイズの多い画像ラベルの悪影響を軽減でき、高性能cnnベースの分類器を訓練するのに有用である。
このデータセットには、25万以上のノイズの多いwebイメージがインターネットからクロールされ、50,000のきめ細かなセマンティクスクラスから生成されたクエリを使っています。
いくつかの人気のあるベンチマーク(Webvision, ImageNet, Clothing-1M)と提案したAliProductsの大規模な実験により、最先端のパフォーマンスを実現した。
SINetは、WebVision Challenge 2019の分類タスクで優勝し、他の競争相手よりも大きな差で勝っている。
関連論文リスト
- Adaptive Noise-Tolerant Network for Image Segmentation [1.57731592348751]
そこで本研究では,非完全・ノイズセグメンテーションとオフザシェルフセグメンテーションアルゴリズムを組み合わせることで,適応型ノイズ耐性ネットワーク(ANTN)モデルにより,より優れたセグメンテーション結果が得られるかどうかを考察する。
1)複数のノイズラベルを1つのディープラーニングモデルに統合できる,(2)確率的パラメータを含む雑音分割モデリングは、与えられたテスト画像の外観に応じて適応する,という2つの新しい側面で、ノイズラベルのディープラーニングを画像セグメンテーションに拡張する。
論文 参考訳(メタデータ) (2025-01-13T09:49:34Z) - Noise-Tolerant Hybrid Prototypical Learning with Noisy Web Data [72.32706907910477]
我々は,大量の関連性はあるがノイズの多いラベル付けされたWeb画像から,バイアスのない分類器を学習する際の課題に焦点をあてる。
クリーンで多くのノイズの多いシナリオでは、無関係なノイズのある画像が存在するため、クラスプロトタイプは深刻なバイアスを受けることができる。
提案手法では,ノイズ画像の明瞭な分割による多様性を考慮し,最適化の相違を克服する。
論文 参考訳(メタデータ) (2025-01-05T08:21:43Z) - UnSeg: One Universal Unlearnable Example Generator is Enough against All Image Segmentation [64.01742988773745]
未承認のプライベートデータ上での大規模なイメージセグメンテーションモデルのトレーニングに関して、プライバシーに関する懸念が高まっている。
我々は、学習不可能な例の概念を利用して、学習不可能なノイズを原画像に生成し、付加することにより、モデルトレーニングに使用不能な画像を作成する。
6つのメインストリームイメージセグメンテーションタスク、10つの広く使われているデータセット、7つの異なるネットワークアーキテクチャでUnSegの有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-13T16:34:46Z) - Exploiting Category Names for Few-Shot Classification with
Vision-Language Models [78.51975804319149]
大規模データに事前訓練された視覚言語基礎モデルは、多くの視覚的理解タスクに強力なツールを提供する。
本稿では,カテゴリ名を用いて分類ヘッドを初期化することにより,少数ショット分類の性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2022-11-29T21:08:46Z) - Multi-label Iterated Learning for Image Classification with Label
Ambiguity [3.5736176624479654]
単一ラベルからの多ラベル学習の帰納バイアスを組み込むために,多ラベル反復学習(MILe)を提案する。
MILeは、バイナリ予測を伝搬することにより、画像のマルチラベル記述を構築する、シンプルだが効果的な手順である。
我々は,MILeがラベルノイズを効果的に低減し,WebVisionのような実世界の大規模ノイズデータに対して最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-11-23T22:10:00Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Learning from Noisy Labels with Noise Modeling Network [7.523041606515877]
ノイズモデリングネットワーク(NMN)は、私たちの畳み込みニューラルネットワーク(CNN)に従い、それを統合します。
NMNはノイズデータから直接ノイズパターンの分布を学習する。
統合NMN/CNN学習システムでは,一貫した分類性能の向上が期待できる。
論文 参考訳(メタデータ) (2020-05-01T20:32:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。