論文の概要: Bag of Tricks for Retail Product Image Classification
- arxiv url: http://arxiv.org/abs/2001.03992v1
- Date: Sun, 12 Jan 2020 20:20:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 04:33:28.391664
- Title: Bag of Tricks for Retail Product Image Classification
- Title(参考訳): 商品画像分類のためのトリックの袋
- Authors: Muktabh Mayank Srivastava
- Abstract要約: 各種小売商品画像分類データセットの深層学習モデルの精度を高めるための様々な手法を提案する。
Local-Concepts-Accumulation (LCA)層と呼ばれる新しいニューラルネットワーク層は、複数のデータセット間で一貫したゲインを提供する。
小売商品の識別精度を高めるための他の方法として、Instagram-pretrained Convnet と Maximum Entropy があげられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Retail Product Image Classification is an important Computer Vision and
Machine Learning problem for building real world systems like self-checkout
stores and automated retail execution evaluation. In this work, we present
various tricks to increase accuracy of Deep Learning models on different types
of retail product image classification datasets. These tricks enable us to
increase the accuracy of fine tuned convnets for retail product image
classification by a large margin. As the most prominent trick, we introduce a
new neural network layer called Local-Concepts-Accumulation (LCA) layer which
gives consistent gains across multiple datasets. Two other tricks we find to
increase accuracy on retail product identification are using an
instagram-pretrained Convnet and using Maximum Entropy as an auxiliary loss for
classification.
- Abstract(参考訳): 小売商品画像分類は、セルフチェックアウトストアや自動小売実行評価のような現実のシステムを構築する上で重要なコンピュータビジョンと機械学習の問題である。
本研究では,各種小売商品画像分類データセットの深層学習モデルの精度を高めるための様々な手法を提案する。
これらの手法により、小売商品画像分類のための微調整コンブネットの精度を大きなマージンで向上させることができる。
最も顕著なトリックとして、複数のデータセットで一貫したゲインを提供する、Local-Concepts-Accumulation (LCA)層と呼ばれる新しいニューラルネットワーク層を導入する。
小売製品識別の精度を高めるための他の2つのトリックは、instagramでトレーニング済みのconvnetを使用して、最大エントロピーを分類の補助損失として使用することです。
関連論文リスト
- Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - RetailKLIP : Finetuning OpenCLIP backbone using metric learning on a
single GPU for Zero-shot retail product image classification [0.0]
本稿では,CLIPモデルの視覚エンコーダの微細化について提案する。
最寄りの近隣の分類では、新製品の漸進的な訓練は必要とせず、リソースと待ち時間を節約できる。
論文 参考訳(メタデータ) (2023-12-16T01:23:42Z) - Scalable Federated Learning for Clients with Different Input Image Sizes
and Numbers of Output Categories [34.22635158366194]
フェデレートラーニング(Federated Learning)とは、複数のクライアントからトレーニングを受けるが、機密データを共有しないプライバシー保護トレーニング手法である。
本稿では,クライアントの入力画像サイズと出力カテゴリ数に応じて,各クライアントのローカルモデルの深さと幅を調節する,ScalableFLという効果的なフェデレーション学習手法を提案する。
論文 参考訳(メタデータ) (2023-11-15T05:43:14Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - Self Supervised Learning for Few Shot Hyperspectral Image Classification [57.2348804884321]
HSI分類に自己監督学習(SSL)を活用することを提案する。
最先端のSSLアルゴリズムであるBarlow-Twinsを用いて,ラベルのない画素にエンコーダを事前学習することにより,少数のラベルを持つ正確なモデルが得られることを示す。
論文 参考訳(メタデータ) (2022-06-24T07:21:53Z) - Memory Classifiers: Two-stage Classification for Robustness in Machine
Learning [19.450529711560964]
本稿では,分散シフトに対するロバスト性を改善する新しい分類法を提案する。
データの高レベル構造に関する専門知識を標準分類器と組み合わせる。
標準データ拡張技術を超える改善を示す。
論文 参考訳(メタデータ) (2022-06-10T18:44:45Z) - Masked Unsupervised Self-training for Zero-shot Image Classification [98.23094305347709]
Masked Unsupervised Self-Training (MUST)は、疑似ラベルと生画像という2つの異なる、補完的な監督源を活用する新しいアプローチである。
MUSTはCLIPを大きなマージンで改善し、教師なしと教師なしの分類のパフォーマンスギャップを狭める。
論文 参考訳(メタデータ) (2022-06-07T02:03:06Z) - An Improved Deep Learning Approach For Product Recognition on Racks in
Retail Stores [2.470815298095903]
小売店における自動製品認識は、コンピュータビジョンとパターン認識の領域における重要な現実世界のアプリケーションである。
我々は、Faster-RCNNベースのオブジェクトローカライザとResNet-18ベースのイメージエンコーダからなる2段階物体検出認識パイプラインを開発した。
各モデルは、より優れた予測のために適切なデータセットを使用して微調整され、各クエリイメージ上でデータ拡張が行われ、ResNet-18ベースの製品認識モデルを微調整するための広範なギャラリーセットが作成される。
論文 参考訳(メタデータ) (2022-02-26T06:51:36Z) - Using Contrastive Learning and Pseudolabels to learn representations for
Retail Product Image Classification [0.0]
本研究では,Convnetのバックボーン全体を微調整して商品イメージの分類を行うために,コントラスト学習と擬似ラベルに基づく雑音学習を用いて,精度の高い表現を学習する。
論文 参考訳(メタデータ) (2021-10-07T17:29:05Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。