論文の概要: Text Classification for Predicting Multi-level Product Categories
- arxiv url: http://arxiv.org/abs/2109.01084v1
- Date: Thu, 2 Sep 2021 17:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-03 14:06:38.574430
- Title: Text Classification for Predicting Multi-level Product Categories
- Title(参考訳): 多レベル製品カテゴリー予測のためのテキスト分類
- Authors: Hadi Jahanshahi, Ozan Ozyegen, Mucahit Cevik, Beste Bulut, Deniz
Yigit, Fahrettin F. Gonen, Ay\c{s}e Ba\c{s}ar
- Abstract要約: オンラインショッピングプラットフォームでは、製品の詳細な分類がユーザナビゲーションを促進する。
本研究では,食品の商品名分類に焦点をあてる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an online shopping platform, a detailed classification of the products
facilitates user navigation. It also helps online retailers keep track of the
price fluctuations in a certain industry or special discounts on a specific
product category. Moreover, an automated classification system may help to
pinpoint incorrect or subjective categories suggested by an operator. In this
study, we focus on product title classification of the grocery products. We
perform a comprehensive comparison of six different text classification models
to establish a strong baseline for this task, which involves testing both
traditional and recent machine learning methods. In our experiments, we
investigate the generalizability of the trained models to the products of other
online retailers, the dynamic masking of infeasible subcategories for
pretrained language models, and the benefits of incorporating product titles in
multiple languages. Our numerical results indicate that dynamic masking of
subcategories is effective in improving prediction accuracy. In addition, we
observe that using bilingual product titles is generally beneficial, and neural
network-based models perform significantly better than SVM and XGBoost models.
Lastly, we investigate the reasons for the misclassified products and propose
future research directions to further enhance the prediction models.
- Abstract(参考訳): オンラインショッピングプラットフォームでは、製品の詳細な分類がユーザナビゲーションを促進する。
また、オンライン小売業者は特定の業界における価格変動や、特定の商品カテゴリーの特別割引を追跡できる。
さらに、自動分類システムは、オペレータが提案する誤ったカテゴリや主観的なカテゴリをピンポイントするのに役立つ。
本研究では,食料品の商品名分類に焦点をあてた。
従来の機械学習法と最近の機械学習法の両方をテストするための強力なベースラインを確立するため、6つの異なるテキスト分類モデルを包括的に比較した。
実験では,オンライン小売業者の製品に対するトレーニングモデルの一般化可能性,事前学習された言語モデルで実現不可能なサブカテゴリの動的マスキング,複数の言語に製品タイトルを組み込むことによるメリットについて検討した。
その結果,サブカテゴリの動的マスキングは予測精度の向上に有効であることがわかった。
さらに,バイリンガルな製品タイトルの使用は一般的に有益であり,ニューラルネットワークベースのモデルの方がsvmやxgboostモデルよりもはるかに優れた性能を示す。
最後に,誤分類製品の理由を調査し,予測モデルをさらに強化するための今後の研究方向を提案する。
関連論文リスト
- Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。
我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。
我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文 参考訳(メタデータ) (2024-09-23T12:28:40Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - Multi-level Product Category Prediction through Text Classification [0.0]
本稿では、テキスト分類における高度な機械学習モデル、特にLSTMとBERTを適用し、小売業における複数のカテゴリを予測する。
この研究は、ブラジルの堅牢な小売データセットを用いて、商品を複数のカテゴリに分類する際の精度を大幅に向上させる、データ拡張技術と焦点損失関数の適用方法を示す。
論文 参考訳(メタデータ) (2024-03-03T23:10:36Z) - Multi-output Headed Ensembles for Product Item Classification [0.9053163124987533]
本稿では,eコマースカタログを対象としたディープラーニングに基づく分類モデルフレームワークを提案する。
我々は、ロバストな業界標準ベースラインモデルに対する改善を示す。
また,ユーザセッションを用いたモデル性能評価手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T01:23:36Z) - Consistent Text Categorization using Data Augmentation in e-Commerce [1.558017967663767]
一貫性のあるテキスト分類のための新しいフレームワークを提案する。
私たちの目標は、本番レベルのパフォーマンスを維持しながら、モデルの一貫性を改善することです。
論文 参考訳(メタデータ) (2023-05-09T12:47:28Z) - Automated Extraction of Fine-Grained Standardized Product Information
from Unstructured Multilingual Web Data [66.21317300595483]
機械学習の最近の進歩と最近発表された多言語データセットが組み合わさって、堅牢な製品属性抽出を可能にしていることを示す。
私たちのモデルは、オンラインショップや言語、あるいはその両方で、確実に製品属性を予測できます。
論文 参考訳(メタデータ) (2023-02-23T16:26:11Z) - Automatically Discovering Novel Visual Categories with Self-supervised
Prototype Learning [68.63910949916209]
本稿では,大規模な画像収集において未知のカテゴリを識別することを目的とした,新しいカテゴリ発見(NCD)の課題に取り組む。
本稿では,プロトタイプ表現学習とプロトタイプ自己学習という,2つの主要な段階からなる適応型プロトタイプ学習手法を提案する。
本研究では,4つのベンチマークデータセットについて広範な実験を行い,提案手法の有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-08-01T16:34:33Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Counterfactual Inference for Consumer Choice Across Many Product
Categories [6.347014958509367]
我々は,行列因数分解の確率論的モデルに基づく機械学習文献に基づく手法を構築した。
我々のモデルは、それぞれのカテゴリを独立して考える従来のモデリングアプローチよりも改善されていることを示す。
保持データを用いて、当社のモデルは、ある製品に対して最も価格に敏感な消費者を正確に識別できることを示す。
論文 参考訳(メタデータ) (2019-06-06T15:11:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。