論文の概要: MAVE: A Product Dataset for Multi-source Attribute Value Extraction
- arxiv url: http://arxiv.org/abs/2112.08663v1
- Date: Thu, 16 Dec 2021 06:48:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 15:46:59.095219
- Title: MAVE: A Product Dataset for Multi-source Attribute Value Extraction
- Title(参考訳): MAVE:マルチソース属性値抽出のための製品データセット
- Authors: Li Yang, Qifan Wang, Zac Yu, Anand Kulkarni, Sumit Sanghai, Bin Shu,
Jon Elsas, Bhargav Kanagal
- Abstract要約: 製品属性値の抽出をより容易にするための新しいデータセットであるMAVEを紹介する。
MAVEはAmazonページから220万の商品のキュレートされたセットで構成され、1257のユニークなカテゴリに300万の属性値アノテーションがある。
マルチソース製品情報から属性値を効果的に抽出する手法を提案する。
- 参考スコア(独自算出の注目度): 10.429320377835241
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Attribute value extraction refers to the task of identifying values of an
attribute of interest from product information. Product attribute values are
essential in many e-commerce scenarios, such as customer service robots,
product ranking, retrieval and recommendations. While in the real world, the
attribute values of a product are usually incomplete and vary over time, which
greatly hinders the practical applications. In this paper, we introduce MAVE, a
new dataset to better facilitate research on product attribute value
extraction. MAVE is composed of a curated set of 2.2 million products from
Amazon pages, with 3 million attribute-value annotations across 1257 unique
categories. MAVE has four main and unique advantages: First, MAVE is the
largest product attribute value extraction dataset by the number of
attribute-value examples. Second, MAVE includes multi-source representations
from the product, which captures the full product information with high
attribute coverage. Third, MAVE represents a more diverse set of attributes and
values relative to what previous datasets cover. Lastly, MAVE provides a very
challenging zero-shot test set, as we empirically illustrate in the
experiments. We further propose a novel approach that effectively extracts the
attribute value from the multi-source product information. We conduct extensive
experiments with several baselines and show that MAVE is an effective dataset
for attribute value extraction task. It is also a very challenging task on
zero-shot attribute extraction. Data is available at {\it
\url{https://github.com/google-research-datasets/MAVE}}.
- Abstract(参考訳): 属性値抽出(英: attribute value extraction)は、製品情報から興味のある属性の値を識別するタスクである。
製品属性の価値は、カスタマサービスロボット、製品ランキング、検索、レコメンデーションなど、多くのeコマースシナリオにおいて不可欠です。
現実の世界では、製品の属性値は通常不完全であり、時間とともに変化するため、実用的な応用を著しく妨げている。
本稿では,製品属性値の抽出をより容易にするための新しいデータセットであるmaveを紹介する。
MAVEはAmazonページから220万の商品をキュレートしたもので、1257のユニークなカテゴリに300万の属性値アノテーションがある。
まず、MAVEは属性値の例の数で最大の製品属性値抽出データセットである。
第二に、MAVEは製品からのマルチソース表現を含み、高い属性カバレッジで製品の全情報をキャプチャします。
第3に、MAVEは、以前のデータセットがカバーするものと比較して、より多様な属性と値のセットを表す。
最後に、MAVEは実験で実証的に説明したように、非常に難しいゼロショットテストセットを提供します。
さらに,マルチソース製品情報から属性値を効果的に抽出する手法を提案する。
いくつかのベースラインで広範な実験を行い、MAVEが属性値抽出タスクに有効なデータセットであることを示す。
また、ゼロショット属性抽出の非常に難しいタスクでもある。
データは {\it \url{https://github.com/google-research-datasets/MAVE}}で入手できる。
関連論文リスト
- Using LLMs for the Extraction and Normalization of Product Attribute
Values [51.45146101802871]
本稿では,大型言語モデル(LLM)を用いて,製品タイトルや製品記述から属性値を抽出し,正規化する可能性について検討する。
実験の結果, GPT-4はPLMに基づく抽出法を10%上回り, F1スコア91%を達成した。
論文 参考訳(メタデータ) (2024-03-04T15:39:59Z) - Product Attribute Value Extraction using Large Language Models [56.96665345570965]
事前学習言語モデル(PLM)に基づく最先端属性/値抽出手法は2つの欠点に直面している。
我々は,大規模言語モデル(LLM)を,既存の属性/値抽出法に代わる,より訓練的なデータ効率,より堅牢な代替手段として活用する可能性を探る。
論文 参考訳(メタデータ) (2023-10-19T07:39:00Z) - AE-smnsMLC: Multi-Label Classification with Semantic Matching and
Negative Label Sampling for Product Attribute Value Extraction [42.79022954630978]
商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。
以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。
属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
論文 参考訳(メタデータ) (2023-10-11T02:22:28Z) - Product Information Extraction using ChatGPT [69.12244027050454]
本稿では,製品記述から属性/値対を抽出するChatGPTの可能性について検討する。
以上の結果から,ChatGPTは事前学習した言語モデルに類似した性能を達成できるが,微調整を行うにはトレーニングデータや計算処理がはるかに少ないことが示唆された。
論文 参考訳(メタデータ) (2023-06-23T09:30:01Z) - Simple and Effective Knowledge-Driven Query Expansion for QA-Based
Product Attribute Extraction [6.752749933406399]
eコマースサイトから価値を抽出する上で重要な課題は、さまざまな製品に対する多数の属性の扱い方だ。
本稿では,QAに基づくAVEに対するクエリ(属性)の応答(値)に基づいた知識駆動型クエリ拡張を提案する。
論文 参考訳(メタデータ) (2022-06-28T19:43:57Z) - OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak
Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。
本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。
我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文 参考訳(メタデータ) (2022-04-29T04:16:04Z) - AdaTag: Multi-Attribute Value Extraction from Product Profiles with
Adaptive Decoding [55.89773725577615]
本稿ではアダプティブデコーディングを用いて属性抽出を行うAdaTagを提案する。
実世界のeコマースデータセットに関する我々の実験は、以前の方法よりも顕著に改善されたことを示している。
論文 参考訳(メタデータ) (2021-06-04T07:54:11Z) - Multimodal Joint Attribute Prediction and Value Extraction for
E-commerce Product [40.46223408546036]
商品属性値は、カスタマサービスロボット、製品レコメンデーション、製品検索など、多くのEコマースシナリオにおいて不可欠である。
現実の世界では、製品の属性値は通常不完全であり、時間とともに変化するため、実用的な応用を著しく妨げている。
本稿では,製品属性を共同で予測し,製品イメージの助けを借りてテキスト製品記述から価値を抽出するマルチモーダル手法を提案する。
論文 参考訳(メタデータ) (2020-09-15T15:10:51Z) - Joint Item Recommendation and Attribute Inference: An Adaptive Graph
Convolutional Network Approach [61.2786065744784]
レコメンデーションシステムでは、ユーザとアイテムは属性に関連付けられ、ユーザはアイテムの好みを表示する。
ユーザ(item)属性をアノテートすることは労働集約的なタスクであるため、属性値が欠落している多くの属性値と不完全であることが多い。
本稿では,共同項目推薦と属性推論のための適応グラフ畳み込みネットワーク(AGCN)アプローチを提案する。
論文 参考訳(メタデータ) (2020-05-25T10:50:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。