論文の概要: Machine Learning approaches to do size based reasoning on Retail Shelf
objects to classify product variants
- arxiv url: http://arxiv.org/abs/2110.03783v1
- Date: Thu, 7 Oct 2021 20:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-11 14:13:45.464448
- Title: Machine Learning approaches to do size based reasoning on Retail Shelf
objects to classify product variants
- Title(参考訳): Retail Shelfオブジェクトによるサイズに基づく推論による製品変種分類のための機械学習アプローチ
- Authors: Muktabh Mayank Srivastava, Pratyush Kumar
- Abstract要約: ディープラーニングベースのコンピュータビジョン手法は、小売店の商品を検知し、それらを分類するために使用することができる。
視覚的にまったく同じように見える製品には、さまざまなサイズのバリエーションがあり、それらを区別するための方法は、棚の上の他の製品と相対的なサイズを見ることである。
これにより、コンピュータビジョンアルゴリズムだけで、サイズベースの変種を互いに解読するプロセスが現実的ではない。
- 参考スコア(独自算出の注目度): 3.3767251810292955
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: There has been a surge in the number of Machine Learning methods to analyze
products kept on retail shelves images. Deep learning based computer vision
methods can be used to detect products on retail shelves and then classify
them. However, there are different sized variants of products which look
exactly the same visually and the method to differentiate them is to look at
their relative sizes with other products on shelves. This makes the process of
deciphering the sized based variants from each other using computer vision
algorithms alone impractical. In this work, we propose methods to ascertain the
size variant of the product as a downstream task to an object detector which
extracts products from shelf and a classifier which determines product brand.
Product variant determination is the task which assigns a product variant to
products of a brand based on the size of bounding boxes and brands predicted by
classifier. While gradient boosting based methods work well for products whose
facings are clear and distinct, a noise accommodating Neural Network method is
proposed for cases where the products are stacked irregularly.
- Abstract(参考訳): 小売店の棚に保管されている製品を分析するための機械学習手法が急増している。
ディープラーニングに基づくコンピュータビジョン手法は、小売店の商品を検出し、それらを分類するために使用できる。
しかし、全く同じ視覚的に見える製品には、異なるサイズのバリエーションがあり、それらを区別する方法は、棚にある他の製品と相対的なサイズを見ることである。
これにより、コンピュータビジョンアルゴリズムだけで、サイズベースの変種を互いに解読するプロセスが現実的ではない。
本研究では,棚から製品を抽出する物体検出器と,製品ブランドを決定する分類器に対して,下流タスクとして製品のサイズ変種を確認する手法を提案する。
製品変量決定は、分類器によって予測される境界ボックスやブランドのサイズに基づいて、商品変量決定をブランドの製品に割り当てるタスクである。
グラデーションブースティングに基づく手法は, 面が明瞭で明瞭な製品に対して有効であるが, 製品が不規則に積み重ねられた場合のノイズ調整ニューラルネットワーク法が提案されている。
関連論文リスト
- Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。
我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。
我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文 参考訳(メタデータ) (2024-09-23T12:28:40Z) - Improving Online Lane Graph Extraction by Object-Lane Clustering [106.71926896061686]
本稿では,局所レーングラフの推定精度を向上させるために,アーキテクチャと損失の定式化を提案する。
提案手法は,中心線をクラスタ中心とすることで,対象を中心線に割り当てることを学ぶ。
提案手法は既存の3次元オブジェクト検出手法の出力を用いて,大幅な性能向上を実現することができることを示す。
論文 参考訳(メタデータ) (2023-07-20T15:21:28Z) - VISTA: Vision Transformer enhanced by U-Net and Image Colorfulness Frame
Filtration for Automatic Retail Checkout [0.7250756081498245]
ビデオシーケンスから個々のフレームをセグメント化し分類することを提案する。
セグメンテーション法は、統一された単一製品アイテムと手作業のセグメンテーションと、エントロピーマスキングからなる。
我々のベストシステムは、AIシティチャレンジ2022トラック4で3位を獲得し、F1スコアは0.4545である。
論文 参考訳(メタデータ) (2022-04-23T08:54:28Z) - Text Classification for Predicting Multi-level Product Categories [0.0]
オンラインショッピングプラットフォームでは、製品の詳細な分類がユーザナビゲーションを促進する。
本研究では,食品の商品名分類に焦点をあてる。
論文 参考訳(メタデータ) (2021-09-02T17:00:05Z) - eProduct: A Million-Scale Visual Search Benchmark to Address Product
Recognition Challenges [8.204924070199866]
eProductは、実世界のさまざまなビジュアル検索ソリューションのトレーニングと評価のためのベンチマークデータセットである。
本稿では,eProductをトレーニングセットと評価セットとして提示し,トレーニングセットには1.3M+のタイトル付き画像と階層的カテゴリラベルが記載されている。
本稿では,eProductの構成手順,多様性の分析,トレーニングしたベースラインモデルの性能について紹介する。
論文 参考訳(メタデータ) (2021-07-13T05:28:34Z) - Visual Transformer for Task-aware Active Learning [49.903358393660724]
プールベースのアクティブラーニングのための新しいパイプラインを提案する。
提案手法は,学習中に使用可能なアンラベリング例を利用して,ラベル付き例との相関関係を推定する。
ビジュアルトランスフォーマーは、ラベル付き例と非ラベル付き例の間の非ローカルビジュアル概念依存性をモデル化する。
論文 参考訳(メタデータ) (2021-06-07T17:13:59Z) - Interpretable Methods for Identifying Product Variants [0.2589904091148018]
製品の種類を識別する新しい手法を提案する。
制約付きクラスタリングと調整されたNLP技術を組み合わせている。
精度の高い要求を満たすなど、特定のビジネス基準を満たすアルゴリズムを設計します。
論文 参考訳(メタデータ) (2021-04-12T14:37:16Z) - Visualization of Supervised and Self-Supervised Neural Networks via
Attribution Guided Factorization [87.96102461221415]
クラスごとの説明性を提供するアルゴリズムを開発した。
実験の広範なバッテリーでは、クラス固有の可視化のための手法の能力を実証する。
論文 参考訳(メタデータ) (2020-12-03T18:48:39Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。