論文の概要: Mix-Ecom: Towards Mixed-Type E-Commerce Dialogues with Complex Domain Rules
- arxiv url: http://arxiv.org/abs/2509.23836v1
- Date: Sun, 28 Sep 2025 12:19:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.478787
- Title: Mix-Ecom: Towards Mixed-Type E-Commerce Dialogues with Complex Domain Rules
- Title(参考訳): Mix-Ecom: 複雑なドメインルールを備えた混合型Eコマース対話を目指して
- Authors: Chenyu Zhou, Xiaoming Shi, Hui Qiu, Xiawu Zheng, Haitao Leng, Yankai Jiang, Shaoguo Liu, Tingting Gao, Rongrong Ji,
- Abstract要約: この研究はまず、Mix-EComと呼ばれる新しいコーパスを紹介した。これは、実際のカスタマーサービス対話とポストプロセッシングに基づいて構築され、ユーザのプライバシを削除し、CoTプロセスを追加する。
具体的には、4つの対話型(QA,レコメンデーション,タスク指向対話,チャット)、3つのeコマースタスク型(プレセール,ロジスティクス,アフターセール)、82のeコマースルールを含んでいる。
その結果、現在のeコマースエージェントはeコマース対話を扱う十分な能力を持っていないことがわかった。
- 参考スコア(独自算出の注目度): 68.95862698403302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: E-commerce agents contribute greatly to helping users complete their e-commerce needs. To promote further research and application of e-commerce agents, benchmarking frameworks are introduced for evaluating LLM agents in the e-commerce domain. Despite the progress, current benchmarks lack evaluating agents' capability to handle mixed-type e-commerce dialogue and complex domain rules. To address the issue, this work first introduces a novel corpus, termed Mix-ECom, which is constructed based on real-world customer-service dialogues with post-processing to remove user privacy and add CoT process. Specifically, Mix-ECom contains 4,799 samples with multiply dialogue types in each e-commerce dialogue, covering four dialogue types (QA, recommendation, task-oriented dialogue, and chit-chat), three e-commerce task types (pre-sales, logistics, after-sales), and 82 e-commerce rules. Furthermore, this work build baselines on Mix-Ecom and propose a dynamic framework to further improve the performance. Results show that current e-commerce agents lack sufficient capabilities to handle e-commerce dialogues, due to the hallucination cased by complex domain rules. The dataset will be publicly available.
- Abstract(参考訳): 電子商取引エージェントは、ユーザーが電子商取引のニーズを完了させるのに大いに貢献する。
電子商取引エージェントのさらなる研究と応用を促進するため、電子商取引領域におけるLLMエージェントの評価のためのベンチマークフレームワークが導入された。
進歩にもかかわらず、現在のベンチマークでは、混合型Eコマース対話と複雑なドメインルールを扱うエージェントの能力の評価が不足している。
この問題に対処するため、この研究はMix-EComと呼ばれる新しいコーパスを導入し、これは実際のカスタマーサービス対話とポストプロセッシングに基づいて構築され、ユーザのプライバシを排除し、CoTプロセスを追加する。
具体的には、4つの対話型(QA,レコメンデーション,タスク指向対話,チャット)、3つのeコマースタスク型(プレセール,ロジスティクス,アフターセール)、82のeコマースルールを含んでいる。
さらに、この作業はMix-Ecom上でベースラインを構築し、パフォーマンスをさらに改善するための動的フレームワークを提案する。
結果として、現在のEコマースエージェントは、複雑なドメインルールによる幻覚のために、eコマース対話を扱う十分な能力が欠如していることが示されている。
データセットは一般公開される予定だ。
関連論文リスト
- ECom-Bench: Can LLM Agent Resolve Real-World E-commerce Customer Support Issues? [20.83383124467603]
ECom-Benchは、eコマース顧客サポートドメインにおいて、マルチモーダル機能を備えたLLMエージェントを評価するための最初のベンチマークフレームワークである。
ECom-Benchは、実際のeコマース顧客インタラクションから収集されたペルソナ情報と、真正なeコマース対話から派生した現実的なタスクデータセットに基づく動的ユーザシミュレーションを特徴とする。
論文 参考訳(メタデータ) (2025-07-08T03:35:48Z) - EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association [83.4879773429742]
本稿では,E-Commerce Script Planning(EcomScript)の課題を3つの逐次サブタスクとして定義する。
本稿では,各ステップに製品を関連付けることで,拡張性のある製品リッチスクリプトの生成を可能にする新しいフレームワークを提案する。
最初の大規模なEcomScriptデータセットであるEcomScriptBenchを構築しました。
論文 参考訳(メタデータ) (2025-05-21T07:21:38Z) - ChineseEcomQA: A Scalable E-commerce Concept Evaluation Benchmark for Large Language Models [15.940958043509463]
我々は,eコマースの基本的な概念に着目した,スケーラブルな質問応答ベンチマークである textbf ChineseEcomQA を提案する。
基本的な概念は、さまざまなeコマースタスクに適用できるように設計されている。
一般性と特異性を慎重にバランスさせることで、ChinaEcomQAは広範囲にわたるeコマースのコンセプトを効果的に区別する。
論文 参考訳(メタデータ) (2025-02-27T15:36:00Z) - Conversational Recommender System and Large Language Model Are Made for Each Other in E-commerce Pre-sales Dialogue [80.51690477289418]
会話推薦システム(CRS)は、ユーザ表現を学習し、対話コンテキストに基づいて正確なレコメンデーションを提供するが、外部知識に依存している。
大規模言語モデル(LLM)は、微調整後の事前販売の対話を模倣する応答を生成するが、正確なレコメンデーションのためのドメイン固有の知識は欠如している。
本稿では,eコマース事前販売対話におけるLCMとCRSの組み合わせの有効性について検討する。
論文 参考訳(メタデータ) (2023-10-23T07:00:51Z) - U-NEED: A Fine-grained Dataset for User Needs-Centric E-commerce
Conversational Recommendation [59.81301478480005]
現実のEコマースシナリオからユーザニーズ中心のEコマース対話推薦データセット(U-NEED)を構築した。
U-NEEDは,5つのカテゴリ (ii) 333,879のユーザ行動と, (iii) 332,148の製品知識の3種類のリソースで構成されている。
論文 参考訳(メタデータ) (2023-05-05T01:44:35Z) - Automatic Controllable Product Copywriting for E-Commerce [58.97059802658354]
我々は、JD.comのeコマースレコメンデーションプラットフォームに、Eコマースのプレフィックスベースのコントロール可能なコピーライティング生成をデプロイする。
提案するECCCGの有効性を検証する実験を行った。
本稿では,リアルタイムのJD.com電子商取引レコメンデーションプラットフォームに,ECCCGと連携するデプロイアーキテクチャを導入する。
論文 参考訳(メタデータ) (2022-06-21T04:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。