Fugu-MT 論文翻訳(概要): Product Information Extraction using ChatGPT

論文の概要: Product Information Extraction using ChatGPT

arxiv url: http://arxiv.org/abs/2306.14921v1
Date: Fri, 23 Jun 2023 09:30:01 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-28 16:08:58.926767
Title: Product Information Extraction using ChatGPT
Title（参考訳）: ChatGPTを用いた製品情報抽出
Authors: Alexander Brinkmann, Roee Shraga, Reng Chiz Der, Christian Bizer
Abstract要約: 本稿では,製品記述から属性/値対を抽出するChatGPTの可能性について検討する。以上の結果から,ChatGPTは事前学習した言語モデルに類似した性能を達成できるが,微調整を行うにはトレーニングデータや計算処理がはるかに少ないことが示唆された。
参考スコア（独自算出の注目度）: 69.12244027050454
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Structured product data in the form of attribute/value pairs is the foundation of many e-commerce applications such as faceted product search, product comparison, and product recommendation. Product offers often only contain textual descriptions of the product attributes in the form of titles or free text. Hence, extracting attribute/value pairs from textual product descriptions is an essential enabler for e-commerce applications. In order to excel, state-of-the-art product information extraction methods require large quantities of task-specific training data. The methods also struggle with generalizing to out-of-distribution attributes and attribute values that were not a part of the training data. Due to being pre-trained on huge amounts of text as well as due to emergent effects resulting from the model size, Large Language Models like ChatGPT have the potential to address both of these shortcomings. This paper explores the potential of ChatGPT for extracting attribute/value pairs from product descriptions. We experiment with different zero-shot and few-shot prompt designs. Our results show that ChatGPT achieves a performance similar to a pre-trained language model but requires much smaller amounts of training data and computation for fine-tuning.
Abstract（参考訳）: 属性/価値ペアという形で構造化された製品データは、ファセットされた製品検索、製品比較、製品推奨など、多くのeコマースアプリケーションの基盤である。製品提供物は、しばしばタイトルまたはフリーテキストの形式で製品属性のテキスト記述のみを含む。したがって、テキスト製品記述から属性/値ペアを抽出することは、eコマースアプリケーションにとって必須のイネーブルである。現状の製品情報抽出手法を最適化するためには,タスク固有の大量のトレーニングデータが必要である。また、トレーニングデータの一部ではない分布外属性や属性値の一般化にも苦労している。大量のテキストで事前トレーニングされていることと、モデルサイズによる創発的な影響のため、ChatGPTのような大規模言語モデルはこれらの欠点に対処する可能性がある。本稿では,製品記述から属性/値対を抽出するChatGPTの可能性を検討する。ゼロショットと数ショットのプロンプトデザインを実験する。以上の結果から,chatgptは事前学習した言語モデルと同様の性能を実現するが,微調整に必要なトレーニングデータや計算量ははるかに少ないことがわかった。

関連論文リスト

Self-Refinement Strategies for LLM-based Product Attribute Value Extraction [51.45146101802871]
本稿では,製品属性値抽出タスクに2つの自己補充手法を適用した。実験の結果, 2つの自己補充技術は, 処理コストを大幅に増大させながら, 抽出性能を著しく向上させることができないことがわかった。開発データを持つシナリオでは、ファインチューニングが最もパフォーマンスが高いのに対して、ファインチューニングの上昇コストは製品記述の量が増加するにつれてバランスがとれる。
論文参考訳（メタデータ） (2025-01-02T12:55:27Z)
PAE: LLM-based Product Attribute Extraction for E-Commerce Fashion Trends [0.6445605125467574]
本稿では,PDF形式のテキストと画像からなる今後のトレンドレポートのための製品属性抽出アルゴリズムであるPAEを提案する。 a) 構造化されていないデータ(テキストと画像)から属性を抽出する効率的なフレームワークであるPAEを開発する; (b) 今後の属性値を用いて既存の属性を検出するためのBERT表現に基づくカタログマッチング方法論を提供する; (c) PAEが有効で柔軟性があり、同等以上の(92.5% F1-Score)フレームワークであることを示す。
論文参考訳（メタデータ） (2024-05-27T17:50:25Z)
JPAVE: A Generation and Classification-based Model for Joint Product Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文参考訳（メタデータ） (2023-11-07T18:36:16Z)
ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction [52.14681890859275]
電子商取引プラットフォームは、属性と値のペアという形で構造化された製品データを必要とする。 BERTベースの抽出法では,タスク固有の大量のトレーニングデータを必要とする。本稿では,大規模言語モデル (LLM) を,より訓練的かつ堅牢な代替手段として活用することを検討する。
論文参考訳（メタデータ） (2023-10-19T07:39:00Z)
Multi-task Item-attribute Graph Pre-training for Strict Cold-start Item Recommendation [71.5871100348448]
ColdGPTは、アイテム内容からきめ細かい属性を抽出することにより、アイテム属性相関をアイテム属性グラフにモデル化する。 ColdGPTは、さまざまな利用可能なデータソース、すなわちアイテムの内容、過去の購入シーケンス、既存のアイテムのレビューテキストから、知識をアイテム属性グラフに転送する。大規模な実験により、ColdGPTは既存のSCSレコメンデーターを大きなマージンで一貫して上回っていることが明らかとなった。
論文参考訳（メタデータ） (2023-06-26T07:04:47Z)
Large Scale Generative Multimodal Attribute Extraction for E-commerce Attributes [23.105116746332506]
eコマースのウェブサイト(Amazonなど)には、製品ページには構造化され、構造化されていない情報(テキストと画像)が多数存在している。販売業者は、商品の属性(色、サイズなど)のラベルやラベルを間違えたりしないことが多い。 3つのキーコンポーネントからなる textbfMXT を用いて,この問題に対するスケーラブルなソリューションを提案する。
論文参考訳（メタデータ） (2023-06-01T06:21:45Z)
OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文参考訳（メタデータ） (2022-04-29T04:16:04Z)
PAM: Understanding Product Images in Cross Product Category Attribute Extraction [40.332066960433245]
この研究は、属性抽出に様々なモダリティを完全に活用するより包括的なフレームワークを提案する。視覚的質問応答における最近の研究に触発されて,製品テキスト,光学的文字認識(OCR)トークン,および製品画像から検出された視覚オブジェクトの表現を融合するために,トランスフォーマーに基づくシーケンスモデルを用いている。フレームワークはさらに拡張されており、複数の製品カテゴリにまたがる属性値を単一のモデルで抽出することができる。
論文参考訳（メタデータ） (2021-06-08T18:30:17Z)
Multimodal Joint Attribute Prediction and Value Extraction for E-commerce Product [40.46223408546036]
商品属性値は、カスタマサービスロボット、製品レコメンデーション、製品検索など、多くのEコマースシナリオにおいて不可欠である。現実の世界では、製品の属性値は通常不完全であり、時間とともに変化するため、実用的な応用を著しく妨げている。本稿では,製品属性を共同で予測し,製品イメージの助けを借りてテキスト製品記述から価値を抽出するマルチモーダル手法を提案する。
論文参考訳（メタデータ） (2020-09-15T15:10:51Z)
Automatic Validation of Textual Attribute Values in E-commerce Catalog by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文参考訳（メタデータ） (2020-06-15T21:31:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。