論文の概要: Visually Similar Products Retrieval for Shopsy
- arxiv url: http://arxiv.org/abs/2210.04560v1
- Date: Mon, 10 Oct 2022 10:59:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 17:55:14.194954
- Title: Visually Similar Products Retrieval for Shopsy
- Title(参考訳): 店舗における視覚的類似商品検索
- Authors: Prajit Nadkarni, Narendra Varma Dasararaju
- Abstract要約: マルチタスク学習手法を用いて,リセラーコマースのためのビジュアル検索システムを設計する。
我々のモデルは属性分類、三重項ランク付け、変分オートエンコーダ(VAE)の3つの異なるタスクからなる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual search is of great assistance in reseller commerce, especially for
non-tech savvy users with affinity towards regional languages. It allows
resellers to accurately locate the products that they seek, unlike textual
search which recommends products from head brands. Product attributes available
in e-commerce have a great potential for building better visual search systems
as they capture fine grained relations between data points. In this work, we
design a visual search system for reseller commerce using a multi-task learning
approach. We also highlight and address the challenges like image compression,
cropping, scribbling on the image, etc, faced in reseller commerce. Our model
consists of three different tasks: attribute classification, triplet ranking
and variational autoencoder (VAE). Masking technique is used for designing the
attribute classification. Next, we introduce an offline triplet mining
technique which utilizes information from multiple attributes to capture
relative order within the data. This technique displays a better performance
compared to the traditional triplet mining baseline, which uses single
label/attribute information. We also compare and report incremental gain
achieved by our unified multi-task model over each individual task separately.
The effectiveness of our method is demonstrated using the in-house dataset of
product images from the Lifestyle business-unit of Flipkart, India's largest
e-commerce company. To efficiently retrieve the images in production, we use
the Approximate Nearest Neighbor (ANN) index. Finally, we highlight our
production environment constraints and present the design choices and
experiments conducted to select a suitable ANN index.
- Abstract(参考訳): ビジュアル検索は、特に非技術に精通した地域言語に親しみのあるユーザーにとって、再販商にとって大きな助けとなる。
ヘッドブランドの商品を推奨するテキスト検索とは異なり、再販業者は探している商品を正確に特定できる。
eコマースで利用可能な製品属性は、データポイント間のきめ細かい関係を捉えることによって、より良いビジュアル検索システムを構築する大きな可能性を秘めている。
本研究では,マルチタスク学習手法を用いて,再販販売のためのビジュアル検索システムを設計する。
また,リセラー商取引で直面する画像圧縮,切り刻み,画像に書き込むといった課題についても強調し,対処する。
我々のモデルは属性分類、三重項ランク付け、変分オートエンコーダ(VAE)の3つの異なるタスクから構成される。
マスキング技術は属性分類の設計に使用される。
次に,複数の属性の情報を用いてデータ内の相対順序をキャプチャするオフライントリプルトマイニング手法を提案する。
このテクニックは、単一のラベル/属性情報を使用する従来のトリプルトマイニングベースラインよりも優れたパフォーマンスを示す。
また、個別のタスクに対して統合マルチタスクモデルによって達成される漸進的なゲインを比較報告する。
本手法の有効性は,インド最大のeコマース企業であるFlipkartのLifestyleビジネスユニットの製品イメージの社内データセットを用いて実証した。
生産中の画像の効率よく検索するには,ANN(Approximate Nearest Neighbor)インデックスを用いる。
最後に、生産環境の制約を強調し、適切なANNインデックスを選択するために行われた設計選択と実験を示す。
関連論文リスト
- PAE: LLM-based Product Attribute Extraction for E-Commerce Fashion Trends [0.6445605125467574]
本稿では,PDF形式のテキストと画像からなる今後のトレンドレポートのための製品属性抽出アルゴリズムであるPAEを提案する。
a) 構造化されていないデータ(テキストと画像)から属性を抽出する効率的なフレームワークであるPAEを開発する; (b) 今後の属性値を用いて既存の属性を検出するためのBERT表現に基づくカタログマッチング方法論を提供する; (c) PAEが有効で柔軟性があり、同等以上の(92.5% F1-Score)フレームワークであることを示す。
論文 参考訳(メタデータ) (2024-05-27T17:50:25Z) - Enhanced E-Commerce Attribute Extraction: Innovating with Decorative
Relation Correction and LLAMA 2.0-Based Annotation [4.81846973621209]
本稿では,分類のためのBERT,属性値抽出のための条件付きランダムフィールド(CRF)層,データアノテーションのための大規模言語モデル(LLM)を統合した先駆的フレームワークを提案する。
提案手法は, CRFのシーケンス復号技術と相乗化したBERTの頑健な表現学習を利用して, 属性値の同定と抽出を行う。
私たちの方法論は、Walmart、BestBuyのEコマースNERデータセット、CoNLLデータセットなど、さまざまなデータセットで厳格に検証されています。
論文 参考訳(メタデータ) (2023-12-09T08:26:30Z) - Product Information Extraction using ChatGPT [69.12244027050454]
本稿では,製品記述から属性/値対を抽出するChatGPTの可能性について検討する。
以上の結果から,ChatGPTは事前学習した言語モデルに類似した性能を達成できるが,微調整を行うにはトレーニングデータや計算処理がはるかに少ないことが示唆された。
論文 参考訳(メタデータ) (2023-06-23T09:30:01Z) - DATE: Domain Adaptive Product Seeker for E-commerce [75.25578276795383]
Product Retrieval (PR) と Grounding (PG) は,テキストクエリに基づいて,それぞれイメージとオブジェクトレベルの製品を求めることを目的としている。
bf Domain bf Adaptive Producbf t Sbf eeker (bf DATE) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-07T14:40:16Z) - e-CLIP: Large-Scale Vision-Language Representation Learning in
E-commerce [9.46186546774799]
本研究では,未ラベルの製品テキストや画像を用いて,言語モデルと視覚モデルとを整合させるコントラスト学習フレームワークを提案する。
我々は、大規模表現学習モデルを訓練し、ドメイン固有の課題に対処するソリューションを共有するために使用したテクニックを提示する。
論文 参考訳(メタデータ) (2022-07-01T05:16:47Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - ItemSage: Learning Product Embeddings for Shopping Recommendations at
Pinterest [60.841761065439414]
Pinterestでは、ItemSageと呼ばれるプロダクトの埋め込みセットを構築して、すべてのショッピングユースケースに適切なレコメンデーションを提供しています。
このアプローチによって、エンゲージメントとコンバージョンメトリクスが大幅に改善され、インフラストラクチャとメンテナンスコストの両方が削減された。
論文 参考訳(メタデータ) (2022-05-24T02:28:58Z) - ACE-BERT: Adversarial Cross-modal Enhanced BERT for E-commerce Retrieval [6.274310862007448]
本稿では,効率的なEコマース検索のための新しいアドリラルクロスモーダル拡張BERT(ACE-BERT)を提案する。
事前訓練された拡張BERTをバックボーンネットワークとして、ACE-BERTは異なるモダリティ表現の分布一貫性を確保するために、逆学習を採用する。
実験の結果,ACE-BERTは検索作業における最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2021-12-14T07:36:20Z) - Pre-training Graph Transformer with Multimodal Side Information for
Recommendation [82.4194024706817]
本稿では,項目側情報とその関連性を考慮した事前学習戦略を提案する。
我々はMCNSamplingという新しいサンプリングアルゴリズムを開発し、各項目のコンテキスト近傍を選択する。
The proposed Pre-trained Multimodal Graph Transformer (PMGT) learns item representations with two objectives: 1) graph structure reconstruction, 2) masked node feature reconstruction。
論文 参考訳(メタデータ) (2020-10-23T10:30:24Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - Large-scale Real-time Personalized Similar Product Recommendations [28.718371564543517]
製品類似性とリアルタイムユーザ興味をモデル化するリアルタイムパーソナライズアルゴリズムを提案する。
本手法は,実世界のeコマースシナリオにおいて,アドカート数に対する10%の改善を実現する。
論文 参考訳(メタデータ) (2020-04-12T23:16:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。