論文の概要: AE-smnsMLC: Multi-Label Classification with Semantic Matching and
Negative Label Sampling for Product Attribute Value Extraction
- arxiv url: http://arxiv.org/abs/2310.07137v1
- Date: Wed, 11 Oct 2023 02:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 00:44:08.595097
- Title: AE-smnsMLC: Multi-Label Classification with Semantic Matching and
Negative Label Sampling for Product Attribute Value Extraction
- Title(参考訳): AE-smnsMLC:製品属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いたマルチラベル分類
- Authors: Zhongfen Deng, Wei-Te Chen, Lei Chen, Philip S. Yu
- Abstract要約: 商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。
以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。
属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
- 参考スコア(独自算出の注目度): 42.79022954630978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Product attribute value extraction plays an important role for many
real-world applications in e-Commerce such as product search and
recommendation. Previous methods treat it as a sequence labeling task that
needs more annotation for position of values in the product text. This limits
their application to real-world scenario in which only attribute values are
weakly-annotated for each product without their position. Moreover, these
methods only use product text (i.e., product title and description) and do not
consider the semantic connection between the multiple attribute values of a
given product and its text, which can help attribute value extraction. In this
paper, we reformulate this task as a multi-label classification task that can
be applied for real-world scenario in which only annotation of attribute values
is available to train models (i.e., annotation of positional information of
attribute values is not available). We propose a classification model with
semantic matching and negative label sampling for attribute value extraction.
Semantic matching aims to capture semantic interactions between attribute
values of a given product and its text. Negative label sampling aims to enhance
the model's ability of distinguishing similar values belonging to the same
attribute. Experimental results on three subsets of a large real-world
e-Commerce dataset demonstrate the effectiveness and superiority of our
proposed model.
- Abstract(参考訳): 商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。
以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱う。
これにより、属性値だけが位置のない各製品に対して弱アノテートされた実世界のシナリオに制限される。
さらに、これらの手法は製品テキスト(すなわち、製品タイトルと説明)のみを使用し、与えられた製品の複数の属性値とそのテキスト間の意味的関係を考慮せず、属性値の抽出に役立つ。
本稿では,属性値のアノテーションのみをトレーニングモデルに適用可能な実世界シナリオに適用可能なマルチラベル分類タスクとして,このタスクを再構成する(属性値の位置情報のアノテーションは利用できない)。
属性値抽出のための意味マッチングと負ラベルサンプリングを用いた分類モデルを提案する。
セマンティックマッチングは、ある商品の属性値とそのテキスト間の意味的相互作用をキャプチャすることを目的としている。
負ラベルサンプリングは、同じ属性に属する類似した値を識別するモデルの能力を高めることを目的としている。
実世界のeコマースデータセットの3つのサブセットに対する実験結果から,提案モデルの有効性と優位性を示した。
関連論文リスト
- Using LLMs for the Extraction and Normalization of Product Attribute
Values [51.45146101802871]
本稿では,大型言語モデル(LLM)を用いて,製品タイトルや製品記述から属性値を抽出し,正規化する可能性について検討する。
実験の結果, GPT-4はPLMに基づく抽出法を10%上回り, F1スコア91%を達成した。
論文 参考訳(メタデータ) (2024-03-04T15:39:59Z) - JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:36:16Z) - Product Attribute Value Extraction using Large Language Models [56.96665345570965]
事前学習言語モデル(PLM)に基づく最先端属性/値抽出手法は2つの欠点に直面している。
我々は,大規模言語モデル(LLM)を,既存の属性/値抽出法に代わる,より訓練的なデータ効率,より堅牢な代替手段として活用する可能性を探る。
論文 参考訳(メタデータ) (2023-10-19T07:39:00Z) - SAGE: Structured Attribute Value Generation for Billion-Scale Product
Catalogs [1.1184789007828977]
SAGEは、世界規模のeコマースカタログにまたがる商品の属性値を推測するためのジェネレーティブLLMである。
本稿では,属性値予測問題をSeq2Seq要約タスクとして新たに定式化する。
SAGEは、eコマースカタログの実践的な設定で生じる属性値予測タスクのすべての側面に取り組むことができる最初の方法である。
論文 参考訳(メタデータ) (2023-09-12T02:24:16Z) - A Unified Generative Approach to Product Attribute-Value Identification [6.752749933406399]
本稿では,製品属性値識別(PAVI)タスクに対する生成的アプローチについて検討する。
我々は、予め訓練された生成モデルT5を微調整し、与えられた製品テキストから属性値対のセットをターゲットシーケンスとしてデコードする。
提案手法が既存の抽出法や分類法よりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2023-06-09T00:33:30Z) - OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak
Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。
本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。
我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文 参考訳(メタデータ) (2022-04-29T04:16:04Z) - Multimodal Joint Attribute Prediction and Value Extraction for
E-commerce Product [40.46223408546036]
商品属性値は、カスタマサービスロボット、製品レコメンデーション、製品検索など、多くのEコマースシナリオにおいて不可欠である。
現実の世界では、製品の属性値は通常不完全であり、時間とともに変化するため、実用的な応用を著しく妨げている。
本稿では,製品属性を共同で予測し,製品イメージの助けを借りてテキスト製品記述から価値を抽出するマルチモーダル手法を提案する。
論文 参考訳(メタデータ) (2020-09-15T15:10:51Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。