論文の概要: Products-10K: A Large-scale Product Recognition Dataset
- arxiv url: http://arxiv.org/abs/2008.10545v1
- Date: Mon, 24 Aug 2020 16:33:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 12:07:40.118905
- Title: Products-10K: A Large-scale Product Recognition Dataset
- Title(参考訳): Products-10K: 大規模製品認識データセット
- Authors: Yalong Bai, Yuxiang Chen, Wei Yu, Linfang Wang, and Wei Zhang
- Abstract要約: 本稿では,「Products-10K」というラベル付き製品画像データセットを構築する。
データセットには、JD.comのオンライン顧客が頻繁に購入する1万のきめ細かいSKUレベルの製品が含まれている。
新しいデータベースに基づいて、きめ細かい製品認識のためのいくつかの有用なヒントやトリックも導入しました。
- 参考スコア(独自算出の注目度): 18.506656670737407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid development of electronic commerce, the way of shopping has
experienced a revolutionary evolution. To fully meet customers' massive and
diverse online shopping needs with quick response, the retailing AI system
needs to automatically recognize products from images and videos at the
stock-keeping unit (SKU) level with high accuracy. However, product recognition
is still a challenging task, since many of SKU-level products are fine-grained
and visually similar by a rough glimpse. Although there are already some
products benchmarks available, these datasets are either too small (limited
number of products) or noisy-labeled (lack of human labeling). In this paper,
we construct a human-labeled product image dataset named "Products-10K", which
contains 10,000 fine-grained SKU-level products frequently bought by online
customers in JD.com. Based on our new database, we also introduced several
useful tips and tricks for fine-grained product recognition. The products-10K
dataset is available via https://products-10k.github.io/.
- Abstract(参考訳): 電子商取引の急速な発展により、ショッピングのやり方は革命的な進化を遂げた。
顧客の大規模で多様なオンラインショッピングニーズを迅速に対応するために、小売AIシステムは、画像やビデオから自動的に商品をストックキーピングユニット(SKU)レベルで高精度に認識する必要がある。
しかし、SKUレベルの製品の多くはきめ細やかで視覚的に類似しているため、製品認識は依然として難しい課題だ。
すでに利用可能な製品ベンチマークはいくつかあるが、これらのデータセットは小さすぎる(限定製品数)か、騒がしい(人間ラベルの不足)かのどちらかである。
本稿では、JD.comのオンライン顧客によって頻繁に購入される1万個の細粒度SKUレベルの製品を含む「Products-10K」というラベル付き製品イメージデータセットを構築する。
当社の新しいデータベースに基づいて,製品認識に有用なヒントやテクニックをいくつか紹介した。
product-10kデータセットはhttps://products-10k.github.io/で入手できる。
関連論文リスト
- Multimodal Prompt Learning for Product Title Generation with Extremely
Limited Labels [66.54691023795097]
本稿では,ラベルが限定された新商品のタイトルを生成するためのプロンプトベースアプローチ,すなわちマルチモーダル・プロンプト学習フレームワークを提案する。
我々は、新しい製品の対応する特性と書体を維持するために、異なるモダリティから多モーダルなプロンプトのセットを構築する。
トレーニング用ラベル付きデータの完全化により,本手法は最先端の結果が得られる。
論文 参考訳(メタデータ) (2023-07-05T00:40:40Z) - Product Information Extraction using ChatGPT [69.12244027050454]
本稿では,製品記述から属性/値対を抽出するChatGPTの可能性について検討する。
以上の結果から,ChatGPTは事前学習した言語モデルに類似した性能を達成できるが,微調整を行うにはトレーニングデータや計算処理がはるかに少ないことが示唆された。
論文 参考訳(メタデータ) (2023-06-23T09:30:01Z) - Automated Extraction of Fine-Grained Standardized Product Information
from Unstructured Multilingual Web Data [66.21317300595483]
機械学習の最近の進歩と最近発表された多言語データセットが組み合わさって、堅牢な製品属性抽出を可能にしていることを示す。
私たちのモデルは、オンラインショップや言語、あるいはその両方で、確実に製品属性を予測できます。
論文 参考訳(メタデータ) (2023-02-23T16:26:11Z) - ItemSage: Learning Product Embeddings for Shopping Recommendations at
Pinterest [60.841761065439414]
Pinterestでは、ItemSageと呼ばれるプロダクトの埋め込みセットを構築して、すべてのショッピングユースケースに適切なレコメンデーションを提供しています。
このアプローチによって、エンゲージメントとコンバージョンメトリクスが大幅に改善され、インフラストラクチャとメンテナンスコストの両方が削減された。
論文 参考訳(メタデータ) (2022-05-24T02:28:58Z) - Unitail: Detecting, Reading, and Matching in Retail Scene [37.1516435926562]
製品に関する基本的な視覚的タスクのベンチマークであるUnited Retailデータセットを紹介します。
1.8Mの四角形のインスタンスで、Unitailは製品の外観をより良く調整するための検出データセットを提供する。
また、1454の製品カテゴリ、30kのテキストリージョン、21kの転写を含むギャラリースタイルのOCRデータセットも提供する。
論文 参考訳(メタデータ) (2022-04-01T09:06:48Z) - eProduct: A Million-Scale Visual Search Benchmark to Address Product
Recognition Challenges [8.204924070199866]
eProductは、実世界のさまざまなビジュアル検索ソリューションのトレーニングと評価のためのベンチマークデータセットである。
本稿では,eProductをトレーニングセットと評価セットとして提示し,トレーニングセットには1.3M+のタイトル付き画像と階層的カテゴリラベルが記載されている。
本稿では,eProductの構成手順,多様性の分析,トレーニングしたベースラインモデルの性能について紹介する。
論文 参考訳(メタデータ) (2021-07-13T05:28:34Z) - Deep Learning-based Online Alternative Product Recommendations at Scale [0.2278231643598956]
テキスト製品情報(例)の両方を使用します。
製品タイトルと説明)と代替製品を推奨する顧客の行動データ。
その結果, オフライン評価やリコール, 精度の面では, 代替製品のカバレッジが大幅に向上した。
論文 参考訳(メタデータ) (2021-04-15T16:27:45Z) - AutoKnow: Self-Driving Knowledge Collection for Products of Thousands of
Types [127.99385433323859]
当社のAutoKnowは、製品に関する情報の整理に対処する自動(自動運転)システムです。
このシステムには、分類学の構築、製品財産の識別、知識抽出、異常検出、同義語発見のための一連の新しい技術が含まれている。
AutoKnowは、1万以上の製品タイプの製品知識を収集している。
論文 参考訳(メタデータ) (2020-06-24T04:35:17Z) - RP2K: A Large-Scale Retail Product Dataset for Fine-Grained Image
Classification [19.82453283089643]
RP2Kは、きめ細かい画像分類のための新しい大規模小売製品データセットである。
これまでのデータセットとは異なり、2000の異なる製品に属する棚の上の小売商品の50万枚以上の画像を集めています。
論文 参考訳(メタデータ) (2020-06-22T21:39:56Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。