論文の概要: Multi-Value-Product Retrieval-Augmented Generation for Industrial Product Attribute Value Identification
- arxiv url: http://arxiv.org/abs/2509.23874v1
- Date: Sun, 28 Sep 2025 13:29:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.499369
- Title: Multi-Value-Product Retrieval-Augmented Generation for Industrial Product Attribute Value Identification
- Title(参考訳): 産業製品属性値同定のための多値検索型生成法
- Authors: Huike Zou, Haiyang Yang, Yindu Su, Liyu Chen, Chengbao Lian, Qingheng Zhang, Shuguang Han, Jufeng Chen,
- Abstract要約: MVP-RAG(Multi-Value-Product Retrieval-Augmented Generation)を紹介する。
MVP-RAGはPAVIを検索生成タスクと定義している。
まず、同じカテゴリと候補属性値の類似した製品を取得し、次に標準化された属性値を生成する。
- 参考スコア(独自算出の注目度): 12.167857724257239
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying attribute values from product profiles is a key task for improving product search, recommendation, and business analytics on e-commerce platforms, which we called Product Attribute Value Identification (PAVI) . However, existing PAVI methods face critical challenges, such as cascading errors, inability to handle out-of-distribution (OOD) attribute values, and lack of generalization capability. To address these limitations, we introduce Multi-Value-Product Retrieval-Augmented Generation (MVP-RAG), combining the strengths of retrieval, generation, and classification paradigms. MVP-RAG defines PAVI as a retrieval-generation task, where the product title description serves as the query, and products and attribute values act as the corpus. It first retrieves similar products of the same category and candidate attribute values, and then generates the standardized attribute values. The key advantages of this work are: (1) the proposal of a multi-level retrieval scheme, with products and attribute values as distinct hierarchical levels in PAVI domain (2) attribute value generation of large language model to significantly alleviate the OOD problem and (3) its successful deployment in a real-world industrial environment. Extensive experimental results demonstrate that MVP-RAG performs better than the state-of-the-art baselines.
- Abstract(参考訳): 製品プロファイルから属性値を特定することは、当社がPAVI(Product Attribute Value Identification)と呼ぶ、eコマースプラットフォーム上での製品検索、レコメンデーション、ビジネス分析を改善するための重要なタスクです。
しかし、既存のPAVI手法では、カスケードエラー、アウト・オブ・ディストリビューション(OOD)属性の処理能力の欠如、一般化能力の欠如など、重要な課題に直面している。
これらの制約に対処するため、我々は、検索、生成、分類パラダイムの強みを組み合わせた、Multi-Value-Product Retrieval-Augmented Generation (MVP-RAG)を導入する。
MVP-RAGはPAVIを検索生成タスクとして定義し、製品タイトル記述がクエリとして機能し、製品と属性値がコーパスとして機能する。
まず、同じカテゴリと候補属性値の類似した製品を取得し、次に標準化された属性値を生成する。
本研究の主な利点は,(1)PAVIドメインにおいて,製品と属性値を異なる階層レベルとする多段階検索方式の提案(2)OOD問題を著しく緩和する大規模言語モデルの属性値生成,(3)実世界の産業環境への展開の成功,である。
MVP-RAGは最先端のベースラインよりも優れた性能を示した。
関連論文リスト
- TACLR: A Scalable and Efficient Retrieval-based Method for Industrial Product Attribute Value Identification [19.911923049421137]
製品属性値識別 (PAVI) のための最初の検索手法である TACLR (Contrastive Learning Retrieval) を導入する。
TACLRは、製品プロファイルと候補値を埋め込みに符号化し、その類似性に基づいて値を取得することにより、情報検索タスクとしてPAVIを定式化する。
1)正規化された出力を生成しながら暗黙的およびOOD値を効果的に処理し、(2)数千のカテゴリ、数千の属性、そして数百万の値にスケールし、(3)高負荷の産業展開のための効率的な推論をサポートする。
論文 参考訳(メタデータ) (2025-01-07T14:45:30Z) - Self-Refinement Strategies for LLM-based Product Attribute Value Extraction [51.45146101802871]
本稿では,製品属性値抽出タスクに2つの自己補充手法を適用した。
実験の結果, 2つの自己補充技術は, 処理コストを大幅に増大させながら, 抽出性能を著しく向上させることができないことがわかった。
開発データを持つシナリオでは、ファインチューニングが最もパフォーマンスが高いのに対して、ファインチューニングの上昇コストは製品記述の量が増加するにつれてバランスがとれる。
論文 参考訳(メタデータ) (2025-01-02T12:55:27Z) - An Empirical Comparison of Generative Approaches for Product Attribute-Value Identification [25.890927969633196]
本稿では,製品属性と価値同定(PAVI)について,これまでで最も包括的な評価を行っている。
3つのデータセット上での微調整エンコーダデコーダモデルに基づく3つの属性値生成戦略を比較した。
実験により、計算効率のよいエンドツーエンドのAVGアプローチは、他の戦略よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-07-01T10:02:17Z) - Using LLMs for the Extraction and Normalization of Product Attribute Values [47.098255866050835]
本稿では,大規模言語モデル(LLM)を用いて,製品タイトルや記述から属性値の抽出と正規化を行う可能性について検討する。
実験のために、Web Data Commons - Product Attribute Value extract (WDC-PAVE)ベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2024-03-04T15:39:59Z) - ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction [52.14681890859275]
電子商取引プラットフォームは、属性と値のペアという形で構造化された製品データを必要とする。
BERTベースの抽出法では,タスク固有の大量のトレーニングデータを必要とする。
本稿では,大規模言語モデル (LLM) を,より訓練的かつ堅牢な代替手段として活用することを検討する。
論文 参考訳(メタデータ) (2023-10-19T07:39:00Z) - A Unified Generative Approach to Product Attribute-Value Identification [6.752749933406399]
本稿では,製品属性値識別(PAVI)タスクに対する生成的アプローチについて検討する。
我々は、予め訓練された生成モデルT5を微調整し、与えられた製品テキストから属性値対のセットをターゲットシーケンスとしてデコードする。
提案手法が既存の抽出法や分類法よりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2023-06-09T00:33:30Z) - OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak
Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。
本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。
我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文 参考訳(メタデータ) (2022-04-29T04:16:04Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。