論文の概要: JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction
- arxiv url: http://arxiv.org/abs/2311.04196v1
- Date: Tue, 7 Nov 2023 18:36:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 14:19:39.325131
- Title: JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction
- Title(参考訳): JPAVE: 製品属性予測と価値抽出のための生成と分類に基づくモデル
- Authors: Zhongfen Deng, Hao Peng, Tao Zhang, Shuaiqi Liu, Wenting Zhao, Yibo
Wang, Philip S. Yu
- Abstract要約: JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
- 参考スコア(独自算出の注目度): 59.94977231327573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Product attribute value extraction is an important task in e-Commerce which
can help several downstream applications such as product search and
recommendation. Most previous models handle this task using sequence labeling
or question answering method which rely on the sequential position information
of values in the product text and are vulnerable to data discrepancy between
training and testing. This limits their generalization ability to real-world
scenario in which each product can have multiple descriptions across various
shopping platforms with different composition of text and style. They also have
limited zero-shot ability to new values. In this paper, we propose a multi-task
learning model with value generation/classification and attribute prediction
called JPAVE to predict values without the necessity of position information of
values in the text. Furthermore, the copy mechanism in value generator and the
value attention module in value classifier help our model address the data
discrepancy issue by only focusing on the relevant part of input text and
ignoring other information which causes the discrepancy issue such as sentence
structure in the text. Besides, two variants of our model are designed for
open-world and closed-world scenarios. In addition, copy mechanism introduced
in the first variant based on value generation can improve its zero-shot
ability for identifying unseen values. Experimental results on a public dataset
demonstrate the superiority of our model compared with strong baselines and its
generalization ability of predicting new values.
- Abstract(参考訳): 製品属性の抽出はeコマースにおいて重要なタスクであり、製品検索やレコメンデーションなどの下流アプリケーションを支援する。
これまでのほとんどのモデルは、製品テキスト内の値のシーケンシャルな位置情報に依存し、トレーニングとテストの間のデータの不一致に弱いシーケンスラベリングや質問応答メソッドを使用してこのタスクを処理します。
これにより、それぞれの製品がテキストとスタイルが異なるさまざまなショッピングプラットフォームにまたがって複数の記述を持つ現実のシナリオへの一般化能力が制限される。
新しい値に対するゼロショット機能も限定されている。
本稿では,テキスト中の値の位置情報を必要としない,JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
さらに、値生成器のコピー機構と値分類器の値注目モジュールは、入力テキストの関連部分のみに着目し、テキスト内の文構造などの不一致の原因となる他の情報を無視することによって、データ不一致問題に対処するのに役立つ。
さらに,オープンワールドとクローズドワールドのシナリオを想定したモデルが2種類ある。
さらに、値生成に基づく最初の変種で導入されたコピー機構は、目に見えない値を識別するゼロショット能力を向上させることができる。
公開データセットにおける実験結果は,強いベースラインと新しい値の予測の一般化と比較して,モデルの優越性を示す。
関連論文リスト
- Exploiting Contextual Target Attributes for Target Sentiment
Classification [53.30511968323911]
TSCの既存のPTLMベースモデルは、1)PTLMをコンテキストエンコーダとして採用した微調整ベースモデル、2)テキスト/単語生成タスクに分類タスクを転送するプロンプトベースモデル、の2つのグループに分類される。
我々は,PTLM を TSC に活用する新たな視点として,言語モデリングと文脈的ターゲット属性による明示的ターゲットコンテキスト相互作用の利点を同時に活用する。
論文 参考訳(メタデータ) (2023-12-21T11:45:28Z) - AE-smnsMLC: Multi-Label Classification with Semantic Matching and
Negative Label Sampling for Product Attribute Value Extraction [42.79022954630978]
商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。
以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。
属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
論文 参考訳(メタデータ) (2023-10-11T02:22:28Z) - SAGE: Structured Attribute Value Generation for Billion-Scale Product
Catalogs [1.1184789007828977]
SAGEは、世界規模のeコマースカタログにまたがる商品の属性値を推測するためのジェネレーティブLLMである。
本稿では,属性値予測問題をSeq2Seq要約タスクとして新たに定式化する。
SAGEは、eコマースカタログの実践的な設定で生じる属性値予測タスクのすべての側面に取り組むことができる最初の方法である。
論文 参考訳(メタデータ) (2023-09-12T02:24:16Z) - Large Language Models are Diverse Role-Players for Summarization
Evaluation [82.31575622685902]
文書要約の品質は、文法や正しさといった客観的な基準と、情報性、簡潔さ、魅力といった主観的な基準で人間の注釈者によって評価することができる。
BLUE/ROUGEのような自動評価手法のほとんどは、上記の次元を適切に捉えることができないかもしれない。
目的と主観の両面から生成されたテキストと参照テキストを比較し,総合的な評価フレームワークを提供するLLMに基づく新しい評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-27T10:40:59Z) - Automated Scoring for Reading Comprehension via In-context BERT Tuning [9.135673900486827]
本稿では,NAEP(National Assessment of Education Progress)自動採点課題に対する(大賞受賞)ソリューションについて報告する。
In-context BERT fine-tuning は、慎重に設計された入力構造を持つ全ての項目に対して単一のスコアリングモデルを生成する。
この課題から得られたトレーニングデータセットを用いて,地域評価によるアプローチの有効性を示す。
論文 参考訳(メタデータ) (2022-05-19T21:16:15Z) - OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak
Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。
本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。
我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文 参考訳(メタデータ) (2022-04-29T04:16:04Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。