論文の概要: Graph-based Multilingual Product Retrieval in E-commerce Search
- arxiv url: http://arxiv.org/abs/2105.02978v1
- Date: Thu, 6 May 2021 21:49:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 23:27:12.540968
- Title: Graph-based Multilingual Product Retrieval in E-commerce Search
- Title(参考訳): Eコマース検索におけるグラフベース多言語製品検索
- Authors: Hanqing Lu, Youna Hu, Tong Zhao, Tony Wu, Yiwei Song, Bing Yin
- Abstract要約: 本稿では,eコマース検索のための数十億件の商品検索を行う汎用多言語検索システムを提案する。
トランスベースの多言語モデルにおける最近の進歩を利用して,多言語グラフの注目に基づく検索ネットワークを提案する。
我々のアルゴリズムは、平均で35%のリコールと25%のmAPで最先端のベースラインを上回ります。
- 参考スコア(独自算出の注目度): 29.156647795471176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nowadays, with many e-commerce platforms conducting global business,
e-commerce search systems are required to handle product retrieval under
multilingual scenarios. Moreover, comparing with maintaining per-country
specific e-commerce search systems, having a universal system across countries
can further reduce the operational and computational costs, and facilitate
business expansion to new countries. In this paper, we introduce a universal
end-to-end multilingual retrieval system, and discuss our learnings and
technical details when training and deploying the system to serve billion-scale
product retrieval for e-commerce search. In particular, we propose a
multilingual graph attention based retrieval network by leveraging recent
advances in transformer-based multilingual language models and graph neural
network architectures to capture the interactions between search queries and
items in e-commerce search. Offline experiments on five countries data show
that our algorithm outperforms the state-of-the-art baselines by 35% recall and
25% mAP on average. Moreover, the proposed model shows significant increase of
conversion/revenue in online A/B experiments and has been deployed in
production for multiple countries.
- Abstract(参考訳): 近年,多くのeコマースプラットフォームがグローバルビジネスを運営しており,多言語シナリオ下での商品検索にはeコマース検索システムが必要である。
さらに、国ごとの特定電子商取引検索システムと比べ、各国に普遍的なシステムを持つことにより、運用コストと計算コストをさらに削減し、新たな国への事業拡大を促進することができる。
本稿では,多言語多言語多言語検索システムについて紹介するとともに,eコマース検索における10億規模の製品検索を提供するシステムをトレーニングし,展開する際の学習と技術的詳細について述べる。
特に,トランスフォーマーに基づく多言語言語モデルとグラフニューラルネットワークアーキテクチャの最近の進歩を活用して,eコマース検索における検索クエリとアイテム間のインタラクションを捉える多言語グラフ注目検索ネットワークを提案する。
5か国のデータによるオフライン実験では、我々のアルゴリズムは平均で35%のリコールと25%のmAPで最先端のベースラインを上回っている。
さらに, オンラインA/B実験では, コンバージョン/レバレッジが著しく増加し, 複数の国で生産されている。
関連論文リスト
- Transfer Learning for E-commerce Query Product Type Prediction [3.092822696545516]
グローバルマルチローカライズeコマース市場におけるQ2PT予測に焦点を当てる。
ローカルごとのQ2PTモデルと統合されたQ2PTモデルをベンチマークし、世界中の店舗でトレーニングデータとモデル構造を共有する。
我々は、世界20カ国にわたる大規模なeコマースデータセット上で、Q2PTモデルの定量的および定性的分析を行う。
論文 参考訳(メタデータ) (2024-09-20T13:30:04Z) - Building a Scalable, Effective, and Steerable Search and Ranking Platform [0.13107669223114085]
現代のeコマースプラットフォームは膨大な製品選択を提供しており、顧客が好きな商品を見つけるのが難しくなっている。
これはeコマースプラットフォームが、ほぼリアルタイムでスケーラブルで適応可能なパーソナライズされたランキングと検索システムを持つための鍵である。
さまざまなユースケースで再利用可能な、パーソナライズされた、ほぼリアルタイムなランキングプラットフォームを提示する。
論文 参考訳(メタデータ) (2024-09-04T16:29:25Z) - SEQ+MD: Learning Multi-Task as a SEQuence with Multi-Distribution Data [5.069855142454979]
マルチタスク学習(MTL)のための逐次学習と,マルチディストリビューション入力のための特徴生成領域マスクを統合したSEQ+MDフレームワークを提案する。
クリック性能を中立に保ちながら、付加品と購入を含む高価値エンゲージメントの増大を示す。
我々のマルチリージョン学習モジュールは"plug-and-play"であり、他のMTLアプリケーションに容易に適応できる。
論文 参考訳(メタデータ) (2024-08-23T20:14:27Z) - SUTRA: Scalable Multilingual Language Model Architecture [5.771289785515227]
我々は50以上の言語でテキストの理解、推論、生成が可能な多言語大言語モデルアーキテクチャSUTRAを紹介する。
広範な評価により、SUTRA は GPT-3.5 や Llama2 といった既存のモデルを 20-30% 上回って、主要なMultitask Language Understanding (MMLU) ベンチマークを上回ります。
以上の結果から,SUTRAは多言語モデル機能において重要なギャップを埋めるだけでなく,AIアプリケーションにおける運用効率とスケーラビリティの新たなベンチマークを確立することが示唆された。
論文 参考訳(メタデータ) (2024-05-07T20:11:44Z) - DIALIGHT: Lightweight Multilingual Development and Evaluation of
Task-Oriented Dialogue Systems with Large Language Models [76.79929883963275]
DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。
ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。
評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文 参考訳(メタデータ) (2024-01-04T11:27:48Z) - Automated Extraction of Fine-Grained Standardized Product Information
from Unstructured Multilingual Web Data [66.21317300595483]
機械学習の最近の進歩と最近発表された多言語データセットが組み合わさって、堅牢な製品属性抽出を可能にしていることを示す。
私たちのモデルは、オンラインショップや言語、あるいはその両方で、確実に製品属性を予測できます。
論文 参考訳(メタデータ) (2023-02-23T16:26:11Z) - Building Machine Translation Systems for the Next Thousand Languages [102.24310122155073]
1500以上の言語を対象としたクリーンでWebマイニングされたデータセットの構築、低サービス言語のための実践的なMTモデルの開発、これらの言語に対する評価指標の限界の検証という3つの研究領域における結果について述べる。
我々の研究は、現在調査中の言語のためのMTシステムの構築に取り組んでいる実践者にとって有用な洞察を提供し、データスパース設定における多言語モデルの弱点を補完する研究の方向性を強調したいと考えています。
論文 参考訳(メタデータ) (2022-05-09T00:24:13Z) - GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented
Dialogue Systems [66.92182084456809]
本稿では,英語のToDデータセットから大規模多言語ToDデータセットであるGlobalWoZを生成する新しいデータキュレーション手法を提案する。
本手法は,対話テンプレートの翻訳と,対象国におけるローカルエンティティの充填に基づく。
我々はデータセットと強力なベースラインのセットを公開し、実際のユースケースにおける多言語ToDシステムの学習を奨励します。
論文 参考訳(メタデータ) (2021-10-14T19:33:04Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - Cross-Lingual Low-Resource Set-to-Description Retrieval for Global
E-Commerce [83.72476966339103]
言語間情報検索は、国境を越えたeコマースにおける新しい課題である。
文脈依存型言語間マッピングの強化を図った新しい言語間マッチングネットワーク(CLMN)を提案する。
実験結果から,提案したCLMNは課題に対して印象的な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2020-05-17T08:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。