論文の概要: Multi-output Headed Ensembles for Product Item Classification
- arxiv url: http://arxiv.org/abs/2307.15858v1
- Date: Sat, 29 Jul 2023 01:23:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 19:05:20.884265
- Title: Multi-output Headed Ensembles for Product Item Classification
- Title(参考訳): 製品項目分類のためのマルチアウトプットヘッドアンサンブル
- Authors: Hotaka Shiokawa and Pradipto Das and Arthur Toth and Justin Chiu
- Abstract要約: 本稿では,eコマースカタログを対象としたディープラーニングに基づく分類モデルフレームワークを提案する。
我々は、ロバストな業界標準ベースラインモデルに対する改善を示す。
また,ユーザセッションを用いたモデル性能評価手法を提案する。
- 参考スコア(独自算出の注目度): 0.9053163124987533
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we revisit the problem of product item classification for
large-scale e-commerce catalogs. The taxonomy of e-commerce catalogs consists
of thousands of genres to which are assigned items that are uploaded by
merchants on a continuous basis. The genre assignments by merchants are often
wrong but treated as ground truth labels in automatically generated training
sets, thus creating a feedback loop that leads to poorer model quality over
time. This problem of taxonomy classification becomes highly pronounced due to
the unavailability of sizable curated training sets.
Under such a scenario it is common to combine multiple classifiers to combat
poor generalization performance from a single classifier. We propose an
extensible deep learning based classification model framework that benefits
from the simplicity and robustness of averaging ensembles and fusion based
classifiers. We are also able to use metadata features and low-level feature
engineering to boost classification performance. We show these improvements
against robust industry standard baseline models that employ hyperparameter
optimization.
Additionally, due to continuous insertion, deletion and updates to real-world
high-volume e-commerce catalogs, assessing model performance for deployment
using A/B testing and/or manual annotation becomes a bottleneck. To this end,
we also propose a novel way to evaluate model performance using user sessions
that provides better insights in addition to traditional measures of precision
and recall.
- Abstract(参考訳): 本稿では,大規模電子商取引カタログの商品分類の問題を再検討する。
電子商取引カタログの分類は数千のジャンルから構成されており、商店が継続的にアップロードするアイテムが割り当てられている。
商人によるジャンルの割り当ては、しばしば間違っているが、自動的に生成されたトレーニングセットにおいて、基底真理ラベルとして扱われる。
分類学分類のこの問題は、スケール可能な訓練セットが利用できないため、非常に顕著になる。
このようなシナリオでは、複数の分類器を組み合わせることで、単一の分類器からの一般化性能の悪さと戦うことが一般的である。
平均的なアンサンブルと融合に基づく分類器の単純さと堅牢性から恩恵を受けることができる拡張可能な深層学習に基づく分類モデルフレームワークを提案する。
メタデータ機能や低レベルの機能エンジニアリングを使って、分類性能を向上することも可能です。
ハイパーパラメータ最適化を用いたロバストな業界標準ベースラインモデルに対するこれらの改善を示す。
さらに、実際のeコマースカタログへの継続的な挿入、削除、更新により、A/Bテストや手動アノテーションを使用したデプロイメントのモデルパフォーマンスの評価がボトルネックとなる。
この目的のために,従来の精度とリコールの尺度に加えて,より優れた洞察を提供するユーザセッションを用いたモデルパフォーマンス評価手法を提案する。
関連論文リスト
- Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。
我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。
我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文 参考訳(メタデータ) (2024-09-23T12:28:40Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - From Categories to Classifiers: Name-Only Continual Learning by Exploring the Web [118.67589717634281]
継続的な学習はしばしば、非現実的に時間がかかり、実際にコストがかかるという仮定である、広範な注釈付きデータセットの可用性に依存します。
時間とコストの制約により手動のアノテーションが禁止される、名前のみの連続学習と呼ばれる新しいパラダイムを探求する。
提案手法は,広範かつ進化を続けるインターネットを活用して,未処理のウェブ教師付きデータを検索・ダウンロードして画像分類を行う。
論文 参考訳(メタデータ) (2023-11-19T10:43:43Z) - Consistent Text Categorization using Data Augmentation in e-Commerce [1.558017967663767]
一貫性のあるテキスト分類のための新しいフレームワークを提案する。
私たちの目標は、本番レベルのパフォーマンスを維持しながら、モデルの一貫性を改善することです。
論文 参考訳(メタデータ) (2023-05-09T12:47:28Z) - Categorizing Items with Short and Noisy Descriptions using Ensembled
Transferred Embeddings [6.282068591820945]
Ensembled Transfered Embeddings (ETE)はアイテム分類のための新しい学習フレームワークである。
ETEは,PayPalが提供した大規模実世界のデータセットにおいて,最先端の項目分類手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-21T18:57:40Z) - Text Classification for Predicting Multi-level Product Categories [0.0]
オンラインショッピングプラットフォームでは、製品の詳細な分類がユーザナビゲーションを促進する。
本研究では,食品の商品名分類に焦点をあてる。
論文 参考訳(メタデータ) (2021-09-02T17:00:05Z) - Active Hybrid Classification [79.02441914023811]
本論文では,クラスタとマシンが分類問題にどう対応できるかを示す。
本稿では,活発な学習と群集分類を編成し,それらを活発なサイクルで組み合わせるアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-01-21T21:09:07Z) - One vs Previous and Similar Classes Learning -- A Comparative Study [2.208242292882514]
この研究は、トレーニングされたモデルをスクラッチから再トレーニングすることなく更新できる3つの学習パラダイムを提案する。
その結果、提案されたパラダイムは更新時のベースラインよりも高速であり、そのうち2つはスクラッチからのトレーニング、特に大規模なデータセットでも高速であることが示された。
論文 参考訳(メタデータ) (2021-01-05T00:28:38Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - Learning Robust Models for e-Commerce Product Search [23.537201383165755]
検索クエリ意図にマッチしないアイテムを表示することは、eコマースにおける顧客エクスペリエンスを低下させる。
問題を緩和するには、大きなラベル付きデータセットが必要である。
我々は、ミスマッチを効果的に分類することを学ぶ、深いエンドツーエンドモデルを開発する。
論文 参考訳(メタデータ) (2020-05-07T17:22:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。