Fugu-MT 論文翻訳(概要): A Unified Generative Approach to Product Attribute-Value Identification

論文の概要: A Unified Generative Approach to Product Attribute-Value Identification

arxiv url: http://arxiv.org/abs/2306.05605v1
Date: Fri, 9 Jun 2023 00:33:30 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-12 15:18:34.973841
Title: A Unified Generative Approach to Product Attribute-Value Identification
Title（参考訳）: 製品属性値識別のための統一生成的アプローチ
Authors: Keiji Shinzato, Naoki Yoshinaga, Yandi Xia and Wei-Te Chen
Abstract要約: 本稿では,製品属性値識別(PAVI)タスクに対する生成的アプローチについて検討する。我々は、予め訓練された生成モデルT5を微調整し、与えられた製品テキストから属性値対のセットをターゲットシーケンスとしてデコードする。提案手法が既存の抽出法や分類法よりも優れていることを示す実験結果を得た。
参考スコア（独自算出の注目度）: 6.752749933406399
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Product attribute-value identification (PAVI) has been studied to link products on e-commerce sites with their attribute values (e.g., <Material, Cotton>) using product text as clues. Technical demands from real-world e-commerce platforms require PAVI methods to handle unseen values, multi-attribute values, and canonicalized values, which are only partly addressed in existing extraction- and classification-based approaches. Motivated by this, we explore a generative approach to the PAVI task. We finetune a pre-trained generative model, T5, to decode a set of attribute-value pairs as a target sequence from the given product text. Since the attribute value pairs are unordered set elements, how to linearize them will matter; we, thus, explore methods of composing an attribute-value pair and ordering the pairs for the task. Experimental results confirm that our generation-based approach outperforms the existing extraction and classification-based methods on large-scale real-world datasets meant for those methods.
Abstract（参考訳）: 製品属性値識別(pavi)は、製品テキストを手掛かりとして、eコマースサイトの製品とその属性値(例えば<material, cotton>)をリンクするために研究されている。現実世界のeコマースプラットフォームからの技術的要求は、既存の抽出および分類に基づくアプローチでのみ対処される未確認値、マルチ属性値、標準値を扱うPAVIメソッドを必要とする。そこで本研究では,PAVIタスクに対する生成的アプローチについて検討する。我々は、予め訓練された生成モデルT5を微調整し、与えられた製品テキストから属性値対のセットをターゲットシーケンスとしてデコードする。属性値ペアは順序付けされていない集合要素であるため、それらを線形化する方法が重要となる。実験結果から,本手法は,既存の抽出および分類に基づく手法よりも優れていることが確認された。

関連論文リスト

Multi-Value-Product Retrieval-Augmented Generation for Industrial Product Attribute Value Identification [12.167857724257239]
MVP-RAG(Multi-Value-Product Retrieval-Augmented Generation)を紹介する。 MVP-RAGはPAVIを検索生成タスクと定義している。まず、同じカテゴリと候補属性値の類似した製品を取得し、次に標準化された属性値を生成する。
論文参考訳（メタデータ） (2025-09-28T13:29:20Z)
TACLR: A Scalable and Efficient Retrieval-based Method for Industrial Product Attribute Value Identification [19.911923049421137]
製品属性値識別(PAVI)の最初の検索手法であるTACLRを紹介する。製品プロファイルと候補値を埋め込みに符号化し、アイテム埋め込みと類似性に基づいて値を取得することにより、情報検索タスクとしてPAVIを定式化する。 1)正規化された出力を生成しながら暗黙的およびOOD値を効果的に処理し、(2)数千のカテゴリ、数万の属性、および数百万の値にスケールし、(3)高負荷の産業シナリオに対する効率的な推論をサポートする。
論文参考訳（メタデータ） (2025-01-07T14:45:30Z)
Self-Refinement Strategies for LLM-based Product Attribute Value Extraction [51.45146101802871]
本稿では,製品属性値抽出タスクに2つの自己補充手法を適用した。実験の結果, 2つの自己補充技術は, 処理コストを大幅に増大させながら, 抽出性能を著しく向上させることができないことがわかった。開発データを持つシナリオでは、ファインチューニングが最もパフォーマンスが高いのに対して、ファインチューニングの上昇コストは製品記述の量が増加するにつれてバランスがとれる。
論文参考訳（メタデータ） (2025-01-02T12:55:27Z)
An Empirical Comparison of Generative Approaches for Product Attribute-Value Identification [25.890927969633196]
本稿では,製品属性と価値同定(PAVI)について,これまでで最も包括的な評価を行っている。 3つのデータセット上での微調整エンコーダデコーダモデルに基づく3つの属性値生成戦略を比較した。実験により、計算効率のよいエンドツーエンドのAVGアプローチは、他の戦略よりも優れていることが示された。
論文参考訳（メタデータ） (2024-07-01T10:02:17Z)
EIVEN: Efficient Implicit Attribute Value Extraction using Multimodal LLM [52.016009472409166]
EIVENは暗黙的な属性値抽出のためのデータおよびパラメータ効率の良い生成フレームワークである。本稿では,モデル混同を減らすための新しい学習・比較手法を提案する。実験の結果,EIVENは暗黙的属性値の抽出において既存の手法よりも有意に優れていることがわかった。
論文参考訳（メタデータ） (2024-04-13T03:15:56Z)
Using LLMs for the Extraction and Normalization of Product Attribute Values [47.098255866050835]
本稿では,大規模言語モデル(LLM)を用いて,製品タイトルや記述から属性値の抽出と正規化を行う可能性について検討する。実験のために、Web Data Commons - Product Attribute Value extract (WDC-PAVE)ベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (2024-03-04T15:39:59Z)
Text-Based Product Matching -- Semi-Supervised Clustering Approach [9.748519919202986]
本稿では,半教師付きクラスタリング手法を用いた製品マッチングの新しい哲学を提案する。実世界のデータセット上でIDECアルゴリズムを実験することにより,本手法の特性について検討する。
論文参考訳（メタデータ） (2024-02-01T18:52:26Z)
Enhanced E-Commerce Attribute Extraction: Innovating with Decorative Relation Correction and LLAMA 2.0-Based Annotation [4.81846973621209]
本稿では,分類のためのBERT,属性値抽出のための条件付きランダムフィールド(CRF)層,データアノテーションのための大規模言語モデル(LLM)を統合した先駆的フレームワークを提案する。提案手法は, CRFのシーケンス復号技術と相乗化したBERTの頑健な表現学習を利用して, 属性値の同定と抽出を行う。私たちの方法論は、Walmart、BestBuyのEコマースNERデータセット、CoNLLデータセットなど、さまざまなデータセットで厳格に検証されています。
論文参考訳（メタデータ） (2023-12-09T08:26:30Z)
JPAVE: A Generation and Classification-based Model for Joint Product Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文参考訳（メタデータ） (2023-11-07T18:36:16Z)
ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction [52.14681890859275]
電子商取引プラットフォームは、属性と値のペアという形で構造化された製品データを必要とする。 BERTベースの抽出法では,タスク固有の大量のトレーニングデータを必要とする。本稿では,大規模言語モデル (LLM) を,より訓練的かつ堅牢な代替手段として活用することを検討する。
論文参考訳（メタデータ） (2023-10-19T07:39:00Z)
AE-smnsMLC: Multi-Label Classification with Semantic Matching and Negative Label Sampling for Product Attribute Value Extraction [42.79022954630978]
商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
論文参考訳（メタデータ） (2023-10-11T02:22:28Z)
Exploring Generative Models for Joint Attribute Value Extraction from Product Titles [11.444095166873325]
属性値抽出(AVE)は、商品の属性とそれらの値のタイトルまたは記述から抽出する。本稿では,AVEタスクを生成問題として定式化することにより,単語列ベースと位置列ベースという2種類の生成パラダイムを提案する。我々は2つのデータセットで実験を行い、そこでは生成的アプローチが新しい最先端の結果を得る。
論文参考訳（メタデータ） (2022-08-15T11:51:31Z)
OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文参考訳（メタデータ） (2022-04-29T04:16:04Z)
Automatic Validation of Textual Attribute Values in E-commerce Catalog by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文参考訳（メタデータ） (2020-06-15T21:31:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。