論文の概要: Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for
Recommendation and Text Generation
- arxiv url: http://arxiv.org/abs/2307.09688v1
- Date: Wed, 19 Jul 2023 00:08:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 15:44:40.674583
- Title: Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for
Recommendation and Text Generation
- Title(参考訳): Amazon-M2:レコメンデーションとテキスト生成のための多言語マルチローカルショッピングセッションデータセット
- Authors: Wei Jin, Haitao Mao, Zheng Li, Haoming Jiang, Chen Luo, Hongzhi Wen,
Haoyu Han, Hanqing Lu, Zhengyang Wang, Ruirui Li, Zhen Li, Monica Xiao Cheng,
Rahul Goutam, Haiyang Zhang, Karthik Subbian, Suhang Wang, Yizhou Sun,
Jiliang Tang, Bing Yin, Xianfeng Tang
- Abstract要約: Amazon Multi-locale Shopping Sessionデータセット、すなわちAmazon-M2を提示します。
6つの異なるローカライズされた数百万のユーザセッションからなる、最初の多言語データセットである。
注目すべきは、データセットがパーソナライズとユーザの好みの理解を高めるのに役立つことだ。
- 参考スコア(独自算出の注目度): 109.47952972930896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling customer shopping intentions is a crucial task for e-commerce, as it
directly impacts user experience and engagement. Thus, accurately understanding
customer preferences is essential for providing personalized recommendations.
Session-based recommendation, which utilizes customer session data to predict
their next interaction, has become increasingly popular. However, existing
session datasets have limitations in terms of item attributes, user diversity,
and dataset scale. As a result, they cannot comprehensively capture the
spectrum of user behaviors and preferences. To bridge this gap, we present the
Amazon Multilingual Multi-locale Shopping Session Dataset, namely Amazon-M2. It
is the first multilingual dataset consisting of millions of user sessions from
six different locales, where the major languages of products are English,
German, Japanese, French, Italian, and Spanish. Remarkably, the dataset can
help us enhance personalization and understanding of user preferences, which
can benefit various existing tasks as well as enable new tasks. To test the
potential of the dataset, we introduce three tasks in this work: (1)
next-product recommendation, (2) next-product recommendation with domain
shifts, and (3) next-product title generation. With the above tasks, we
benchmark a range of algorithms on our proposed dataset, drawing new insights
for further research and practice. In addition, based on the proposed dataset
and tasks, we hosted a competition in the KDD CUP 2023 and have attracted
thousands of users and submissions. The winning solutions and the associated
workshop can be accessed at our website https://kddcup23.github.io/.
- Abstract(参考訳): 顧客ショッピングの意図をモデル化することは、ユーザー体験やエンゲージメントに直接影響を与えるため、eコマースにとって重要なタスクです。
したがって、パーソナライズドレコメンデーションの提供には、顧客の好みを正確に理解することが不可欠である。
顧客セッションデータを利用して次のインタラクションを予測するセッションベースのレコメンデーションが人気を集めている。
しかし、既存のセッションデータセットにはアイテム属性、ユーザの多様性、データセットスケールの制限がある。
その結果、ユーザー行動や嗜好のスペクトルを包括的に捉えることはできない。
このギャップを埋めるために、Amazon Multilingual Multi-locale Shopping Session Dataset、すなわちAmazon-M2を紹介します。
6つの異なる地域からの数百万のユーザセッションで構成された最初の多言語データセットで、製品の主要言語は英語、ドイツ語、日本語、フランス語、イタリア語、スペイン語である。
注目すべきは、データセットがパーソナライズとユーザの好みの理解を強化するのに役立つことだ。
データセットの可能性をテストするために,(1)次製品推薦,(2)ドメインシフトを伴う次製品推薦,(3)次製品タイトル生成という3つのタスクを導入する。
上記のタスクで、提案するデータセットに様々なアルゴリズムをベンチマークし、さらなる研究と実践のための新たな洞察を導きます。
さらに、提案されたデータセットとタスクに基づいて、kdd cup 2023でコンペを主催し、何千ものユーザと応募者を魅了しました。
勝利したソリューションと関連するワークショップは、当社のwebサイトhttps://kddcup23.github.io/で閲覧できます。
関連論文リスト
- PersonalLLM: Tailoring LLMs to Individual Preferences [11.717169516971856]
我々は、特定のユーザに対して最大限のメリットを提供するためにLLMを適用することに焦点を当てた、PersonalLLMという公開ベンチマークを提示する。
我々は、ユーザーが不均一な潜伏傾向を示すことを期待する高品質な回答と組み合わせたオープンエンドプロンプトをキュレートする。
私たちのデータセットと生成された個人性は、パーソナライズアルゴリズムを開発するための革新的なテストベッドを提供します。
論文 参考訳(メタデータ) (2024-09-30T13:55:42Z) - LLM-ESR: Large Language Models Enhancement for Long-tailed Sequential Recommendation [58.04939553630209]
現実世界のシステムでは、ほとんどのユーザーはほんの一握りのアイテムしか扱わないが、ほとんどのアイテムは滅多に消費されない。
これら2つの課題は、ロングテールユーザーとロングテールアイテムの課題として知られ、しばしば既存のシークエンシャルレコメンデーションシステムに困難をもたらす。
本稿では,これらの課題に対処するため,Large Language Models Enhancement framework for Sequential Recommendation (LLM-ESR)を提案する。
論文 参考訳(メタデータ) (2024-05-31T07:24:42Z) - Multi3WOZ: A Multilingual, Multi-Domain, Multi-Parallel Dataset for
Training and Evaluating Culturally Adapted Task-Oriented Dialog Systems [64.40789703661987]
Multi3WOZは、新しいマルチ言語、マルチドメイン、マルチ並列ToDデータセットである。
大規模で、4つの言語で文化的に適応したダイアログを提供する。
最終データセットを生成する複雑なボトムアップデータ収集プロセスについて述べる。
論文 参考訳(メタデータ) (2023-07-26T08:29:42Z) - XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented
Languages [105.54207724678767]
データ不足は、多言語NLPシステムの開発において重要な問題である。
我々はXTREME-UPを提案する。XTREME-UPはゼロショットではなく、希少なデータシナリオに焦点を当てたベンチマークである。
XTREME-UPは、88言語にまたがる言語モデルが、9つのキーとなるユーザー中心技術上で機能する能力を評価する。
論文 参考訳(メタデータ) (2023-05-19T18:00:03Z) - Dynamic Slate Recommendation with Gated Recurrent Units and Thompson
Sampling [6.312395952874578]
我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。
本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。
我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
論文 参考訳(メタデータ) (2021-04-30T15:16:35Z) - COOKIE: A Dataset for Conversational Recommendation over Knowledge
Graphs in E-commerce [64.95907840457471]
我々は,COOKIEと呼ばれる電子商取引プラットフォームにおける知識グラフに対する対話的推薦のための新しいデータセットを提案する。
データセットはAmazonのレビューコーパスから構築され、ユーザエージェント対話とカスタムナレッジグラフを統合してレコメンデーションする。
論文 参考訳(メタデータ) (2020-08-21T00:11:31Z) - Efficient Deployment of Conversational Natural Language Interfaces over
Databases [45.52672694140881]
本稿では、自然言語からクエリ言語への機械学習モデルを開発するためのトレーニングデータセット収集を高速化する新しい手法を提案する。
本システムでは,対話セッションを定義した対話型多言語データを生成することができる。
論文 参考訳(メタデータ) (2020-05-31T19:16:27Z) - Cross-Lingual Low-Resource Set-to-Description Retrieval for Global
E-Commerce [83.72476966339103]
言語間情報検索は、国境を越えたeコマースにおける新しい課題である。
文脈依存型言語間マッピングの強化を図った新しい言語間マッチングネットワーク(CLMN)を提案する。
実験結果から,提案したCLMNは課題に対して印象的な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2020-05-17T08:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。