論文の概要: PSCon: Product Search Through Conversations
- arxiv url: http://arxiv.org/abs/2502.13881v3
- Date: Sun, 27 Apr 2025 11:19:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 14:13:21.319004
- Title: PSCon: Product Search Through Conversations
- Title(参考訳): PSCon: 会話による製品検索
- Authors: Jie Zou, Mohammad Aliannejadi, Evangelos Kanoulas, Shuxi Han, Heli Ma, Zheng Wang, Yang Yang, Heng Tao Shen,
- Abstract要約: Conversational Product Search (CPS)システムは自然言語でユーザと対話し、パーソナライズされたコンテキスト対応の製品リストを提供する。
CPSに関する既存の研究のほとんどは、人間のような言語によって駆動される実際のCPSデータセットが欠如しているため、シミュレートされた会話に限られている。
本稿では,CPSデータ収集プロトコルを提案し,PSConと呼ばれる新しいCPSデータセットを作成する。
- 参考スコア(独自算出の注目度): 55.94925947614474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conversational Product Search ( CPS ) systems interact with users via natural language to offer personalized and context-aware product lists. However, most existing research on CPS is limited to simulated conversations, due to the lack of a real CPS dataset driven by human-like language. Moreover, existing conversational datasets for e-commerce are constructed for a particular market or a particular language and thus can not support cross-market and multi-lingual usage. In this paper, we propose a CPS data collection protocol and create a new CPS dataset, called PSCon, which assists product search through conversations with human-like language. The dataset is collected by a coached human-human data collection protocol and is available for dual markets and two languages. By formulating the task of CPS, the dataset allows for comprehensive and in-depth research on six subtasks: user intent detection, keyword extraction, system action prediction, question selection, item ranking, and response generation. Moreover, we present a concise analysis of the dataset and propose a benchmark model on the proposed CPS dataset. Our proposed dataset and model will be helpful for facilitating future research on CPS.
- Abstract(参考訳): Conversational Product Search (CPS)システムは自然言語でユーザと対話し、パーソナライズされたコンテキスト対応の製品リストを提供する。
しかし、CPSに関する既存の研究のほとんどは、人間のような言語によって駆動される実際のCPSデータセットが欠如しているため、シミュレートされた会話に限られている。
さらに、電子商取引のための既存の会話データセットは、特定の市場または特定の言語のために構築されており、したがって、市場横断および多言語使用をサポートしない。
本稿では,CPSデータ収集プロトコルを提案し,PSConと呼ばれる新しいCPSデータセットを作成する。
データセットは、トレーニングされた人間と人間のデータ収集プロトコルによって収集され、デュアルマーケットと2つの言語で利用可能である。
CPSのタスクを定式化することにより、ユーザ意図の検出、キーワード抽出、システムアクション予測、質問選択、項目ランキング、応答生成の6つのサブタスクについて、包括的で詳細な調査が可能になる。
さらに,データセットの簡潔な解析を行い,提案したCPSデータセットのベンチマークモデルを提案する。
提案するデータセットとモデルは,今後のCPS研究に役立つだろう。
関連論文リスト
- Enhancing Multilingual Language Models for Code-Switched Input Data [0.0]
本研究では,コード切替データセット上でのマルチ言語BERT(mBERT)の事前学習により,重要なNLPタスクにおけるモデルの性能が向上するかどうかを検討する。
本研究では,Spanglish ツイートのデータセットを用いて事前学習を行い,ベースラインモデルに対する事前学習モデルの評価を行う。
以上の結果から,事前学習したmBERTモデルは,与えられたタスクのベースラインモデルよりも優れ,また,音声タグ付けの分野でも有意な改善が見られた。
論文 参考訳(メタデータ) (2025-03-11T02:49:41Z) - Polish-ASTE: Aspect-Sentiment Triplet Extraction Datasets for Polish [1.6874375111244329]
ポーランド語で表現されたホテルと購入品に関する顧客の意見を含むASTEのための2つの新しいデータセットを提示する。
また,2つのASTE手法と2つの大きな言語モデルを組み合わせた実験を行い,その性能と組立データセットの難しさについて検討した。
新しいデータセットはパーミッシブライセンスの下で利用可能で、英語のデータセットと同じファイルフォーマットで、将来の研究での使用が促進される。
論文 参考訳(メタデータ) (2025-02-27T12:38:04Z) - Wizard of Shopping: Target-Oriented E-commerce Dialogue Generation with Decision Tree Branching [39.45679213036939]
会話型商品検索(CPS)の目的は、インテリジェントなチャットベースのショッピングアシスタントを開発することである。
本稿では,大規模言語モデル(LLM)を利用して,現実的で自然な会話を生成する新しい手法TRACERを提案する。
We release the first target-oriented CPS dataset Wizard of Shopping (WoS)。
論文 参考訳(メタデータ) (2025-02-03T00:27:13Z) - Automated Question Generation on Tabular Data for Conversational Data Exploration [1.2574534342156884]
本稿では,会話環境におけるデータセットの関連するスライスに基づいて,自然言語で興味深い質問を推薦するシステムを提案する。
我々は、訓練済みの言語モデル(T5)の微調整のバリエーションを使って、特定の方法で自然言語の質問を生成する。
論文 参考訳(メタデータ) (2024-07-10T08:07:05Z) - SER_AMPEL: a multi-source dataset for speech emotion recognition of
Italian older adults [58.49386651361823]
SER_AMPELは、音声感情認識のためのマルチソースデータセットである。
イタリア人の高齢者の場合、音声による感情認識の基準を提供する目的で収集される。
このようなデータセットの必要性の証拠は、技術の現状の分析から生まれる。
論文 参考訳(メタデータ) (2023-11-24T13:47:25Z) - XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented
Languages [105.54207724678767]
データ不足は、多言語NLPシステムの開発において重要な問題である。
我々はXTREME-UPを提案する。XTREME-UPはゼロショットではなく、希少なデータシナリオに焦点を当てたベンチマークである。
XTREME-UPは、88言語にまたがる言語モデルが、9つのキーとなるユーザー中心技術上で機能する能力を評価する。
論文 参考訳(メタデータ) (2023-05-19T18:00:03Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Exploiting Unsupervised Data for Emotion Recognition in Conversations [76.01690906995286]
会話における感情認識(Emotion Recognition in Conversations:ERC)は、会話における話者の感情状態を予測することを目的としている。
ERCタスクの教師付きデータは限られている。
教師なし会話データを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-02T13:28:47Z) - Cross-Lingual Low-Resource Set-to-Description Retrieval for Global
E-Commerce [83.72476966339103]
言語間情報検索は、国境を越えたeコマースにおける新しい課題である。
文脈依存型言語間マッピングの強化を図った新しい言語間マッチングネットワーク(CLMN)を提案する。
実験結果から,提案したCLMNは課題に対して印象的な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2020-05-17T08:10:51Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。