Fugu-MT 論文翻訳(概要): Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for Recommendation and Text Generation

論文の概要: Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for Recommendation and Text Generation

arxiv url: http://arxiv.org/abs/2307.09688v2
Date: Thu, 19 Oct 2023 01:11:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-20 19:30:15.234526
Title: Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for Recommendation and Text Generation
Title（参考訳）: Amazon-M2:レコメンデーションとテキスト生成のための多言語マルチローカルショッピングセッションデータセット
Authors: Wei Jin, Haitao Mao, Zheng Li, Haoming Jiang, Chen Luo, Hongzhi Wen, Haoyu Han, Hanqing Lu, Zhengyang Wang, Ruirui Li, Zhen Li, Monica Xiao Cheng, Rahul Goutam, Haiyang Zhang, Karthik Subbian, Suhang Wang, Yizhou Sun, Jiliang Tang, Bing Yin, Xianfeng Tang
Abstract要約: Amazon Multi-locale Shopping Sessionデータセット、すなわちAmazon-M2を提示します。 6つの異なるローカライズされた数百万のユーザセッションからなる、最初の多言語データセットである。注目すべきは、データセットがパーソナライズとユーザの好みの理解を高めるのに役立つことだ。
参考スコア（独自算出の注目度）: 127.35910314813854
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modeling customer shopping intentions is a crucial task for e-commerce, as it directly impacts user experience and engagement. Thus, accurately understanding customer preferences is essential for providing personalized recommendations. Session-based recommendation, which utilizes customer session data to predict their next interaction, has become increasingly popular. However, existing session datasets have limitations in terms of item attributes, user diversity, and dataset scale. As a result, they cannot comprehensively capture the spectrum of user behaviors and preferences. To bridge this gap, we present the Amazon Multilingual Multi-locale Shopping Session Dataset, namely Amazon-M2. It is the first multilingual dataset consisting of millions of user sessions from six different locales, where the major languages of products are English, German, Japanese, French, Italian, and Spanish. Remarkably, the dataset can help us enhance personalization and understanding of user preferences, which can benefit various existing tasks as well as enable new tasks. To test the potential of the dataset, we introduce three tasks in this work: (1) next-product recommendation, (2) next-product recommendation with domain shifts, and (3) next-product title generation. With the above tasks, we benchmark a range of algorithms on our proposed dataset, drawing new insights for further research and practice. In addition, based on the proposed dataset and tasks, we hosted a competition in the KDD CUP 2023 and have attracted thousands of users and submissions. The winning solutions and the associated workshop can be accessed at our website https://kddcup23.github.io/.
Abstract（参考訳）: 顧客ショッピングの意図をモデル化することは、ユーザー体験やエンゲージメントに直接影響を与えるため、eコマースにとって重要なタスクです。したがって、パーソナライズドレコメンデーションの提供には、顧客の好みを正確に理解することが不可欠である。顧客セッションデータを利用して次のインタラクションを予測するセッションベースのレコメンデーションが人気を集めている。しかし、既存のセッションデータセットにはアイテム属性、ユーザの多様性、データセットスケールの制限がある。その結果、ユーザー行動や嗜好のスペクトルを包括的に捉えることはできない。このギャップを埋めるために、Amazon Multilingual Multi-locale Shopping Session Dataset、すなわちAmazon-M2を紹介します。 6つの異なる地域からの数百万のユーザセッションで構成された最初の多言語データセットで、製品の主要言語は英語、ドイツ語、日本語、フランス語、イタリア語、スペイン語である。注目すべきは、データセットがパーソナライズとユーザの好みの理解を強化するのに役立つことだ。データセットの可能性をテストするために,(1)次製品推薦,(2)ドメインシフトを伴う次製品推薦,(3)次製品タイトル生成という3つのタスクを導入する。上記のタスクで、提案するデータセットに様々なアルゴリズムをベンチマークし、さらなる研究と実践のための新たな洞察を導きます。さらに、提案されたデータセットとタスクに基づいて、kdd cup 2023でコンペを主催し、何千ものユーザと応募者を魅了しました。勝利したソリューションと関連するワークショップは、当社のwebサイトhttps://kddcup23.github.io/で閲覧できます。

関連論文リスト

SessionIntentBench: A Multi-task Inter-session Intention-shift Modeling Benchmark for E-commerce Customer Behavior Understanding [64.45047674586671]
本稿では,意図木の概念を導入し,データセットキュレーションパイプラインを提案する。我々は,L(V)LMsのセッション間意図シフト理解能力を評価するマルチモーダルベンチマークSessionIntentBenchを構築した。 1,952,177の意図的エントリ,1,132,145のセッション意図軌跡,および10,905のセッションを使用してマイニングされた13,003,664のタスクにより,既存のセッションデータを活用可能なスケーラブルな方法を提供する。
論文参考訳（メタデータ） (2025-07-27T09:04:17Z)
PSCon: Product Search Through Conversations [55.94925947614474]
Conversational Product Search (CPS)システムは自然言語でユーザと対話し、パーソナライズされたコンテキスト対応の製品リストを提供する。 CPSに関する既存の研究のほとんどは、人間のような言語によって駆動される実際のCPSデータセットが欠如しているため、シミュレートされた会話に限られている。本稿では,CPSデータ収集プロトコルを提案し,PSConと呼ばれる新しいCPSデータセットを作成する。
論文参考訳（メタデータ） (2025-02-19T17:05:42Z)
PersonalLLM: Tailoring LLMs to Individual Preferences [11.717169516971856]
我々は、特定のユーザに対して最大限のメリットを提供するためにLLMを適用することに焦点を当てた、PersonalLLMという公開ベンチマークを提示する。我々は、ユーザーが不均一な潜伏傾向を示すことを期待する高品質な回答と組み合わせたオープンエンドプロンプトをキュレートする。私たちのデータセットと生成された個人性は、パーソナライズアルゴリズムを開発するための革新的なテストベッドを提供します。
論文参考訳（メタデータ） (2024-09-30T13:55:42Z)
LLM-ESR: Large Language Models Enhancement for Long-tailed Sequential Recommendation [58.04939553630209]
現実世界のシステムでは、ほとんどのユーザーはほんの一握りのアイテムしか扱わないが、ほとんどのアイテムは滅多に消費されない。これら2つの課題は、ロングテールユーザーとロングテールアイテムの課題として知られ、しばしば既存のシークエンシャルレコメンデーションシステムに困難をもたらす。本稿では,これらの課題に対処するため,Large Language Models Enhancement framework for Sequential Recommendation (LLM-ESR)を提案する。
論文参考訳（メタデータ） (2024-05-31T07:24:42Z)
Multi3WOZ: A Multilingual, Multi-Domain, Multi-Parallel Dataset for Training and Evaluating Culturally Adapted Task-Oriented Dialog Systems [64.40789703661987]
Multi3WOZは、新しいマルチ言語、マルチドメイン、マルチ並列ToDデータセットである。大規模で、4つの言語で文化的に適応したダイアログを提供する。最終データセットを生成する複雑なボトムアップデータ収集プロセスについて述べる。
論文参考訳（メタデータ） (2023-07-26T08:29:42Z)
XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented Languages [105.54207724678767]
データ不足は、多言語NLPシステムの開発において重要な問題である。我々はXTREME-UPを提案する。XTREME-UPはゼロショットではなく、希少なデータシナリオに焦点を当てたベンチマークである。 XTREME-UPは、88言語にまたがる言語モデルが、9つのキーとなるユーザー中心技術上で機能する能力を評価する。
論文参考訳（メタデータ） (2023-05-19T18:00:03Z)
Dynamic Slate Recommendation with Gated Recurrent Units and Thompson Sampling [6.312395952874578]
我々は,インターネットプラットフォームのユーザに対して,アイテムリストとしてslatesという,関連するコンテンツを推薦する問題を考える。本稿では,インターネットプラットフォームとユーザ間のインタラクションの時系列に作用する変分ベイズ型リカレントニューラルネットレコメンデータシステムを提案する。我々は,探索的レコメンデーション戦略が,同程度以上の欲望に対して有効であることを実験的に示す。
論文参考訳（メタデータ） (2021-04-30T15:16:35Z)
COOKIE: A Dataset for Conversational Recommendation over Knowledge Graphs in E-commerce [64.95907840457471]
我々は,COOKIEと呼ばれる電子商取引プラットフォームにおける知識グラフに対する対話的推薦のための新しいデータセットを提案する。データセットはAmazonのレビューコーパスから構築され、ユーザエージェント対話とカスタムナレッジグラフを統合してレコメンデーションする。
論文参考訳（メタデータ） (2020-08-21T00:11:31Z)
Efficient Deployment of Conversational Natural Language Interfaces over Databases [45.52672694140881]
本稿では、自然言語からクエリ言語への機械学習モデルを開発するためのトレーニングデータセット収集を高速化する新しい手法を提案する。本システムでは,対話セッションを定義した対話型多言語データを生成することができる。
論文参考訳（メタデータ） (2020-05-31T19:16:27Z)
Cross-Lingual Low-Resource Set-to-Description Retrieval for Global E-Commerce [83.72476966339103]
言語間情報検索は、国境を越えたeコマースにおける新しい課題である。文脈依存型言語間マッピングの強化を図った新しい言語間マッチングネットワーク(CLMN)を提案する。実験結果から,提案したCLMNは課題に対して印象的な結果をもたらすことが示唆された。
論文参考訳（メタデータ） (2020-05-17T08:10:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。