論文の概要: Transfer Learning for E-commerce Query Product Type Prediction
- arxiv url: http://arxiv.org/abs/2410.07121v1
- Date: Fri, 20 Sep 2024 13:30:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 22:17:22.793006
- Title: Transfer Learning for E-commerce Query Product Type Prediction
- Title(参考訳): E-Commerce Query Product Type Prediction のためのトランスファー学習
- Authors: Anna Tigunova, Thomas Ricatte, Ghadir Eraisha,
- Abstract要約: グローバルマルチローカライズeコマース市場におけるQ2PT予測に焦点を当てる。
ローカルごとのQ2PTモデルと統合されたQ2PTモデルをベンチマークし、世界中の店舗でトレーニングデータとモデル構造を共有する。
我々は、世界20カ国にわたる大規模なeコマースデータセット上で、Q2PTモデルの定量的および定性的分析を行う。
- 参考スコア(独自算出の注目度): 3.092822696545516
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Getting a good understanding of the customer intent is essential in e-commerce search engines. In particular, associating the correct product type to a search query plays a vital role in surfacing correct products to the customers. Query product type classification (Q2PT) is a particularly challenging task because search queries are short and ambiguous, the number of existing product categories is extremely large, spanning thousands of values. Moreover, international marketplaces face additional challenges, such as language and dialect diversity and cultural differences, influencing the interpretation of the query. In this work we focus on Q2PT prediction in the global multilocale e-commerce markets. The common approach of training Q2PT models for each locale separately shows significant performance drops in low-resource stores. Moreover, this method does not allow for a smooth expansion to a new country, requiring to collect the data and train a new locale-specific Q2PT model from scratch. To tackle this, we propose to use transfer learning from the highresource to the low-resource locales, to achieve global parity of Q2PT performance. We benchmark the per-locale Q2PT model against the unified one, which shares the training data and model structure across all worldwide stores. Additionally, we compare locale-aware and locale-agnostic Q2PT models, showing the task dependency on the country-specific traits. We conduct extensive quantiative and qualitative analysis of Q2PT models on the large-scale e-commerce dataset across 20 worldwide locales, which shows that unified locale-aware Q2PT model has superior performance over the alternatives.
- Abstract(参考訳): eコマース検索エンジンでは、顧客の意図をよく理解することが不可欠だ。
特に、正しい商品タイプを検索クエリに関連付けることは、顧客に対して正しい商品を提示する上で重要な役割を担っている。
クエリ製品タイプ分類(Q2PT)は、検索クエリが短く曖昧であるため、既存の製品カテゴリの数が非常に多く、数千の値にまたがるため、特に難しいタスクである。
さらに、国際市場は、言語や方言の多様性、文化的な違いといった追加の課題に直面し、クエリの解釈に影響を与える。
本研究は、グローバルマルチローカライズeコマース市場におけるQ2PT予測に焦点を当てる。
各ローカライズ毎にQ2PTモデルをトレーニングする一般的なアプローチは、低リソースストアで大幅なパフォーマンス低下を示す。
さらに,本手法では,新たな国へのスムーズな展開が不可能であり,データ収集と新たなローカライズ特化Q2PTモデルをスクラッチからトレーニングする必要がある。
そこで本研究では,高リソースから低リソースのローカライズへの変換学習を用いて,Q2PT性能のグローバルな同等性を実現することを提案する。
ローカルごとのQ2PTモデルと統合されたQ2PTモデルをベンチマークし、世界中の店舗でトレーニングデータとモデル構造を共有する。
さらに,各地域別Q2PTモデルと地域別Q2PTモデルを比較し,国別特性のタスク依存性を示す。
グローバルな20の地域を対象とした大規模なeコマースデータセット上で,Q2PTモデルの定量的および定性的な分析を行い,各地域を意識したQ2PTモデルの方が,代替品よりも優れた性能を示した。
関連論文リスト
- SEQ+MD: Learning Multi-Task as a SEQuence with Multi-Distribution Data [5.069855142454979]
マルチタスク学習(MTL)のための逐次学習と,マルチディストリビューション入力のための特徴生成領域マスクを統合したSEQ+MDフレームワークを提案する。
クリック性能を中立に保ちながら、付加品と購入を含む高価値エンゲージメントの増大を示す。
我々のマルチリージョン学習モジュールは"plug-and-play"であり、他のMTLアプリケーションに容易に適応できる。
論文 参考訳(メタデータ) (2024-08-23T20:14:27Z) - M2QA: Multi-domain Multilingual Question Answering [63.191474328757366]
入力変動に対する一般化と堅牢性は、機械学習研究の核となるデシダータである。
マルチドメイン多言語質問応答ベンチマークであるM2QAを紹介する。
M2QAには、ドイツ語、トルコ語、中国語で13500のSQuAD 2.0スタイルの質問応答インスタンスが含まれている。
論文 参考訳(メタデータ) (2024-07-01T08:48:49Z) - Datasets for Multilingual Answer Sentence Selection [59.28492975191415]
ヨーロッパ5言語(フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語)でAS2のための新しい高品質データセットを導入する。
その結果、我々のデータセットは、堅牢で強力な多言語AS2モデルを作成する上で重要なものであることが示唆された。
論文 参考訳(メタデータ) (2024-06-14T16:50:29Z) - Solving Price Per Unit Problem Around the World: Formulating Fact
Extraction as Question Answering [4.094848360328624]
プライス・パー・ユニット(PPU)は、商品を比較する際に、eコマースのウェブサイトで買い物をする消費者にとって重要な情報である。
我々は、事実抽出のための名前付きエンティティ認識(NER)タスクではなく、質問応答(QA)タスクとしてこの問題を定式化する。
我々のQAアプローチは、ルールベースの手法を34.4%精度で上回り、また世界中の店舗でBERTベースの事実抽出手法も優れている。
論文 参考訳(メタデータ) (2022-04-12T06:43:48Z) - Towards Best Practices for Training Multilingual Dense Retrieval Models [54.91016739123398]
我々は,このような設計を用いて,多種多様言語における単言語検索の課題に焦点をあてる。
本研究は多言語高密度検索モデルのトレーニングのための「ベストプラクティス」ガイドとして組織されている。
論文 参考訳(メタデータ) (2022-04-05T17:12:53Z) - Delving Deeper into Cross-lingual Visual Question Answering [115.16614806717341]
標準学習装置に簡単な修正を加えることで、モノリンガル英語のパフォーマンスへの移行ギャップを大幅に減らすことができることを示す。
多言語マルチモーダル変換器の多言語間VQAを多言語間VQAで解析する。
論文 参考訳(メタデータ) (2022-02-15T18:22:18Z) - Graph-based Multilingual Product Retrieval in E-commerce Search [29.156647795471176]
本稿では,eコマース検索のための数十億件の商品検索を行う汎用多言語検索システムを提案する。
トランスベースの多言語モデルにおける最近の進歩を利用して,多言語グラフの注目に基づく検索ネットワークを提案する。
我々のアルゴリズムは、平均で35%のリコールと25%のmAPで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2021-05-06T21:49:10Z) - Multilingual Answer Sentence Reranking via Automatically Translated Data [97.98885151955467]
本稿では,現代の質問応答システム(QA)のコアコンポーネントである,多言語回答文選択(AS2)モデルの設計について述べる。
主なアイデアは、あるリソースリッチ言語(英語など)から、他の言語へのデータ転送であり、リソースの観点からはよりリッチである。
論文 参考訳(メタデータ) (2021-02-20T03:52:08Z) - Modeling Household Online Shopping Demand in the U.S.: A Machine
Learning Approach and Comparative Investigation between 2009 and 2017 [0.0]
本稿では、2009年と2017年の全米家庭旅行調査(NHTS)データを2回リリースし、家庭レベルのオンラインショッピング購入を予測する機械学習(ML)モデルを開発した。
機械学習技術の最新の2つの進歩、すなわちShapley値に基づく特徴重要度と累積局所効果プロットは、現在のMLモデリングにおける一般的なテクニックの固有の欠点を克服するために採用されている。
得られたモデルと洞察は、オンラインショッピング関連貨物需要生成に利用することができ、関連する政策がオンラインショッピング需要に与える影響を評価できる可能性がある。
論文 参考訳(メタデータ) (2021-01-11T03:45:53Z) - Cross-Lingual Low-Resource Set-to-Description Retrieval for Global
E-Commerce [83.72476966339103]
言語間情報検索は、国境を越えたeコマースにおける新しい課題である。
文脈依存型言語間マッピングの強化を図った新しい言語間マッチングネットワーク(CLMN)を提案する。
実験結果から,提案したCLMNは課題に対して印象的な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2020-05-17T08:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。