論文の概要: Distant-Supervised Slot-Filling for E-Commerce Queries
- arxiv url: http://arxiv.org/abs/2012.08134v1
- Date: Tue, 15 Dec 2020 07:46:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 05:32:21.794914
- Title: Distant-Supervised Slot-Filling for E-Commerce Queries
- Title(参考訳): 遠隔監視型Eコマースクエリのスロットフィリング
- Authors: Saurav Manchanda and Mohit Sharma and George Karypis
- Abstract要約: スロット充填は、対応する意図された製品特性を持つクエリ内の個々の用語をアノテートするタスクを指します。
スロット充填の従来の方法は、地上の真理スロットアノテーション情報を含むトレーニングデータの可用性を必要とします。
手動アノテーションを必要としない遠隔監視確率生成モデルを提案する。
- 参考スコア(独自算出の注目度): 13.673052804154125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Slot-filling refers to the task of annotating individual terms in a query
with the corresponding intended product characteristics (product type, brand,
gender, size, color, etc.). These characteristics can then be used by a search
engine to return results that better match the query's product intent.
Traditional methods for slot-filling require the availability of training data
with ground truth slot-annotation information. However, generating such labeled
data, especially in e-commerce is expensive and time-consuming because the
number of slots increases as new products are added. In this paper, we present
distant-supervised probabilistic generative models, that require no manual
annotation. The proposed approaches leverage the readily available historical
query logs and the purchases that these queries led to, and also exploit
co-occurrence information among the slots in order to identify intended product
characteristics. We evaluate our approaches by considering how they affect
retrieval performance, as well as how well they classify the slots. In terms of
retrieval, our approaches achieve better ranking performance (up to 156%) over
Okapi BM25. Moreover, our approach that leverages co-occurrence information
leads to better performance than the one that does not on both the retrieval
and slot classification tasks.
- Abstract(参考訳): スロットフィリング(slot-filling)とは、対象とする製品特性(製品の種類、ブランド、性別、サイズ、色など)をクエリ内で個々の用語にアノテートするタスクである。
これらの特性は、検索エンジンがクエリの製品意図に合致する結果を返すために使用できる。
従来のスロットフィリングの方法は、地上の真実のスロットアノテーション情報を含むトレーニングデータの入手が必要である。
しかし、特に電子商取引におけるラベル付きデータの生成は、新製品の追加に伴ってスロットの数が増えるため、高価で時間を要する。
本稿では,手動アノテーションを必要としない遠隔教師付き確率的生成モデルを提案する。
提案手法は,これらのクエリが引き起こした履歴クエリログと購入情報を活用するとともに,スロット間の共起情報を利用して意図した製品特性を識別する。
提案手法は,検索性能やスロットの分類にどのように影響するかを考慮し,評価を行った。
検索の面では,okapi bm25よりもランク付け性能(最大156%)が向上した。
さらに,共起情報を活用する手法は,検索とスロット分類のタスクを併用しない手法よりも優れた性能をもたらす。
関連論文リスト
- Likelihood as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
言語モデルの性能の効果的な指標としての可能性を示す。
提案手法は,より優れた性能をもたらすプロンプトの選択と構築のための尺度として,疑似可能性を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。
我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。
我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文 参考訳(メタデータ) (2024-09-23T12:28:40Z) - Guiding Catalogue Enrichment with User Queries [8.435621679543464]
我々は、豊かなデータポイントを特定し、汎用的なKGを用いてパフォーマンスの利点を示す直感を示す。
本手法は2つの人気のある百科事典KG, DBPedia と YAGO 4 について検討した。
論文 参考訳(メタデータ) (2024-06-11T09:38:46Z) - Large Language Models for Relevance Judgment in Product Search [48.56992980315751]
検索クエリに対する検索および再ランクされたアイテムの高い関連性は、製品検索の成功の土台である。
本稿では,大規模言語モデル(LLM)を活用して,クエリ・イテムペア(QIP)の関連判断を大規模に自動化する手法について述べる。
本研究は,製品検索における関連判断の自動化の分野への直接的な影響を示唆するものである。
論文 参考訳(メタデータ) (2024-06-01T00:52:41Z) - Enhanced E-Commerce Attribute Extraction: Innovating with Decorative
Relation Correction and LLAMA 2.0-Based Annotation [4.81846973621209]
本稿では,分類のためのBERT,属性値抽出のための条件付きランダムフィールド(CRF)層,データアノテーションのための大規模言語モデル(LLM)を統合した先駆的フレームワークを提案する。
提案手法は, CRFのシーケンス復号技術と相乗化したBERTの頑健な表現学習を利用して, 属性値の同定と抽出を行う。
私たちの方法論は、Walmart、BestBuyのEコマースNERデータセット、CoNLLデータセットなど、さまざまなデータセットで厳格に検証されています。
論文 参考訳(メタデータ) (2023-12-09T08:26:30Z) - OutRank: Speeding up AutoML-based Model Search for Large Sparse Data
sets with Cardinality-aware Feature Ranking [0.0]
特徴量ランキングとデータ品質関連異常検出のためのシステムであるOutRankを紹介する。
提案したアプローチでは,AutoMLのみのアプローチに比べて最大300%大きな機能空間の探索が可能になる。
論文 参考訳(メタデータ) (2023-09-04T12:07:20Z) - Multi-output Headed Ensembles for Product Item Classification [0.9053163124987533]
本稿では,eコマースカタログを対象としたディープラーニングに基づく分類モデルフレームワークを提案する。
我々は、ロバストな業界標準ベースラインモデルに対する改善を示す。
また,ユーザセッションを用いたモデル性能評価手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T01:23:36Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Query Understanding via Intent Description Generation [75.64800976586771]
問合せ理解のためのQ2ID(Query-to-Intent-Description)タスクを提案する。
クエリとその記述を利用してドキュメントの関連性を計算する既存のランキングタスクとは異なり、Q2IDは自然言語のインテント記述を生成するための逆タスクである。
Q2IDタスクにおける複数の最先端生成モデルとの比較により,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-25T08:56:40Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。