論文の概要: Developing a Component Comment Extractor from Product Reviews on
E-Commerce Sites
- arxiv url: http://arxiv.org/abs/2207.05979v1
- Date: Wed, 13 Jul 2022 06:25:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 14:18:35.232352
- Title: Developing a Component Comment Extractor from Product Reviews on
E-Commerce Sites
- Title(参考訳): Eコマースサイトにおける製品レビューからのコンポーネントコメントエクストラクタの開発
- Authors: Shogo Anda, Masato Kikuchi, Tadachika Ozono
- Abstract要約: 文中の商品の成分やアスペクト情報を識別し,収集するシステムを開発した。
BERTベースの分類器は、レビュー中の文にコンポーネントやアスペクトを参照するラベルを割り当てます。
我々のデータ拡張法は、不足データのF1測定を0.66から0.76に改善することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consumers often read product reviews to inform their buying decision, as some
consumers want to know a specific component of a product. However, because
typical sentences on product reviews contain various details, users must
identify sentences about components they want to know amongst the many reviews.
Therefore, we aimed to develop a system that identifies and collects component
and aspect information of products in sentences. Our BERT-based classifiers
assign labels referring to components and aspects to sentences in reviews and
extract sentences with comments on specific components and aspects. We
determined proper labels based for the words identified through pattern
matching from product reviews to create the training data. Because we could not
use the words as labels, we carefully created labels covering the meanings of
the words. However, the training data was imbalanced on component and aspect
pairs. We introduced a data augmentation method using WordNet to reduce the
bias. Our evaluation demonstrates that the system can determine labels for road
bikes using pattern matching, covering more than 88\% of the indicators of
components and aspects on e-commerce sites. Moreover, our data augmentation
method can improve the-F1-measure on insufficient data from 0.66 to 0.76.
- Abstract(参考訳): 消費者は商品の特定のコンポーネントを知りたがっているため、購入決定を伝えるために製品レビューを読むことが多い。
しかし、製品レビューの典型的な文には様々な詳細が含まれているため、ユーザーは多くのレビューの中で知りたいコンポーネントに関する文を識別する必要がある。
そこで本稿では,文中の商品の構成要素やアスペクト情報を識別・収集するシステムを開発することを目的とした。
BERTをベースとした分類器は, 特定の構成要素や側面についてコメントを付した文を抽出し, レビュー中の文にコンポーネントやアスペクトを参照するラベルを割り当てる。
製品レビューから識別された単語のパターンマッチングに基づいて適切なラベルを決定し,トレーニングデータを作成した。
単語をラベルとして使用できないため、単語の意味をカバーしたラベルを慎重に作成しました。
しかし、トレーニングデータはコンポーネントペアとアスペクトペアで不均衡であった。
バイアスを低減するためにWordNetを用いたデータ拡張手法を提案する。
本評価は,Eコマースサイトにおける部品や側面の指標の88%以上を網羅し,パターンマッチングを用いて道路自転車のラベルを決定することができることを示す。
さらに,データ拡張手法により,不備なデータのF1対策を0.66から0.76に改善することができる。
関連論文リスト
- A Usage-centric Take on Intent Understanding in E-Commerce [20.648271216249977]
私たちは、“顧客が製品を使う方法”として、述語的ユーザ意図に注目します。
FolkScopeの2つの弱点、SOTA E-Commerce Intent Graphを特定します。
ユーザ意図を最も望ましい特性を持つ製品と強く結びつける能力を制限する。
論文 参考訳(メタデータ) (2024-02-22T18:09:33Z) - Product Information Extraction using ChatGPT [69.12244027050454]
本稿では,製品記述から属性/値対を抽出するChatGPTの可能性について検討する。
以上の結果から,ChatGPTは事前学習した言語モデルに類似した性能を達成できるが,微調整を行うにはトレーニングデータや計算処理がはるかに少ないことが示唆された。
論文 参考訳(メタデータ) (2023-06-23T09:30:01Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Unsupervised Ranking and Aggregation of Label Descriptions for Zero-Shot
Classifiers [8.434227773463022]
本当のゼロショット設定では、開発セットがないため、良いラベル記述を設計することは難しい。
本研究では, ラベル記述を教師なしの方法で選択するために, 繰り返し評価分析の確率モデルをどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2022-04-20T14:23:09Z) - Fine-Grained Element Identification in Complaint Text of Internet Fraud [47.249423877146604]
本稿では,インターネット不正の苦情文をきめ細かな方法で分析することを提案する。
苦情文には様々な機能を持つ複数の節が含まれていることを考慮し,各節の役割を特定し,異なる種類の不正要素に分類することを提案する。
論文 参考訳(メタデータ) (2021-08-19T13:33:09Z) - Abstractive Opinion Tagging [65.47649273721679]
eコマースでは、意見タグは、アイテムのレビューの特徴を反映したEコマースプラットフォームが提供するタグのランクリストを指す。
意見タグを生成するための現在のメカニズムは、手作業またはラベル付け方法に依存します。
AOT-Net と呼ばれる抽象的な意見タグフレームワークを提案し、多数のレビューからランク付けされた意見タグのリストを生成します。
論文 参考訳(メタデータ) (2021-01-18T05:08:15Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - A Unified Dual-view Model for Review Summarization and Sentiment
Classification with Inconsistency Loss [51.448615489097236]
ユーザーレビューから正確な要約と感情を取得することは、現代のEコマースプラットフォームにとって不可欠な要素である。
本稿では,これら2つのタスクの性能を協調的に改善する新しいデュアルビューモデルを提案する。
異なる領域の4つの実世界のデータセットに対する実験結果から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-06-02T13:34:11Z) - Sentiment Analysis Using Averaged Weighted Word Vector Features [1.2691047660244332]
我々は,異なる種類の単語ベクトルを組み合わせて,レビューの極性を学習し,推定する2つの手法を開発した。
本手法は、感情分析の標準ベンチマークとして使用される異なる領域の複数のデータセットに適用する。
論文 参考訳(メタデータ) (2020-02-13T16:30:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。