論文の概要: SIR: Similar Image Retrieval for Product Search in E-Commerce
- arxiv url: http://arxiv.org/abs/2009.13836v1
- Date: Tue, 29 Sep 2020 07:53:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 05:08:48.965322
- Title: SIR: Similar Image Retrieval for Product Search in E-Commerce
- Title(参考訳): SIR:Eコマースにおける製品検索の類似画像検索
- Authors: Theban Stanley, Nihar Vanjara, Yanxin Pan, Ekaterina Pirogova, Swagata
Chakraborty, Abon Chaudhuri
- Abstract要約: 我々は、視覚的に類似した製品を数百万のカタログで素早く発見するために使用される、類似した画像検索プラットフォームを提示する。
教師付きモデルを構築して、プロダクトイメージにテーマを表すラベルをタグ付けし、後からラベルで検索することで対処できる。
「e-cigarettes」のような新しいテーマや、「プロモーションバッジ付きのイメージ」のような断固としたテーマ、あるいは「ハロウィーンの衣装」のような短い関係のテーマでは役に立たない。
- 参考スコア(独自算出の注目度): 0.16311150636417257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a similar image retrieval (SIR) platform that is used to quickly
discover visually similar products in a catalog of millions. Given the size,
diversity, and dynamism of our catalog, product search poses many challenges.
It can be addressed by building supervised models to tagging product images
with labels representing themes and later retrieving them by labels. This
approach suffices for common and perennial themes like "white shirt" or
"lifestyle image of TV". It does not work for new themes such as
"e-cigarettes", hard-to-define ones such as "image with a promotional badge",
or the ones with short relevance span such as "Halloween costumes". SIR is
ideal for such cases because it allows us to search by an example, not a
pre-defined theme. We describe the steps - embedding computation, encoding, and
indexing - that power the approximate nearest neighbor search back-end. We also
highlight two applications of SIR. The first one is related to the detection of
products with various types of potentially objectionable themes. This
application is run with a sense of urgency, hence the typical time frame to
train and bootstrap a model is not permitted. Also, these themes are often
short-lived based on current trends, hence spending resources to build a
lasting model is not justified. The second application is a variant item
detection system where SIR helps discover visual variants that are hard to find
through text search. We analyze the performance of SIR in the context of these
applications.
- Abstract(参考訳): 我々は、視覚的に類似した製品を数百万のカタログで素早く発見するために使用される類似画像検索(SIR)プラットフォームを提案する。
カタログのサイズ、多様性、ダイナミズムを考えると、製品検索は多くの課題に直面する。
教師付きモデルを構築して、製品イメージにテーマを表すラベルをタグ付けし、後からラベルで検索することで対処できる。
このアプローチは、"white shirt"や"lifestyle image of tv"といった、一般的で多年生のテーマに対して十分である。
e-cigarettes"のような新しいテーマ、"image with a promotional badge"のような定義が難しいテーマ、あるいは"halloween costumes"のような関連性の薄いテーマでは機能しない。
SIRは、事前に定義されたテーマではなく、例で検索できるので、このようなケースには理想的です。
近似した近接探索バックエンドを駆動する計算、エンコーディング、インデックス化のステップについて説明する。
SIRの2つの応用についても強調する。
一つは、さまざまな潜在的に否定的なテーマを持つ製品の検出に関連している。
このアプリケーションは緊急感を持って実行されるため、モデルのトレーニングとブートストラップを行う典型的な時間フレームは許可されない。
また、これらのテーマは現在のトレンドに基づいて短命であることが多いため、永続的なモデルを構築するためにリソースを費やすことは正当化されない。
2つめのアプリケーションは変種アイテム検出システムで、sirはテキスト検索で見つけるのが難しい視覚的な変種を見つけるのに役立ちます。
これらのアプリケーションを用いてSIRの性能を解析する。
関連論文リスト
- Leveraging User-Generated Reviews for Recommender Systems with Dynamic Headers [5.464901224450247]
電子商取引プラットフォームは、顧客のショッピング上の関心を満たすための膨大なアイテムカタログを持っている。
学術文献では、これらのカルーセルの項目のランク付けとリコールセットの生成と向上のために多くのモデルが提案されている。
本研究は,これらのカルーセルのヘッダ生成プロセスをカスタマイズするための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T21:18:21Z) - Multi-word Term Embeddings Improve Lexical Product Retrieval [0.0]
本研究は,eコマースプラットフォームにおける製品記述のオフラインインデックス化を目的としたH1埋め込みモデルについて述べる。
このモデルは、ハイブリッド製品検索システムのフレームワーク内の他の最先端(SoTA)埋め込みモデルと比較される。
検索インデックスのための意味的にリッチな用語語彙を構築するためのアプローチを提案する。
論文 参考訳(メタデータ) (2024-06-03T11:52:52Z) - Towards Video Anomaly Retrieval from Video Anomaly Detection: New
Benchmarks and Model [70.97446870672069]
ビデオ異常検出(VAD)はその潜在的な応用により注目されている。
Video Anomaly Retrieval (VAR)は、関連のある動画をモダリティによって実用的に検索することを目的としている。
一般的な異常データセットの上に構築されたUCFCrime-ARとXD-Violenceの2つのベンチマークを示す。
論文 参考訳(メタデータ) (2023-07-24T06:22:37Z) - LRVS-Fashion: Extending Visual Search with Referring Instructions [13.590668564555195]
提案するReferred Visual Search(RVS)は,ユーザが希望する類似性をより正確に定義できるタスクである。
ファッションカタログから842kの画像が抽出された272kのファッション製品からなる、新しい大規模パブリックデータセットLRVS-Fashionをリリースする。
論文 参考訳(メタデータ) (2023-06-05T14:45:38Z) - Pic2Word: Mapping Pictures to Words for Zero-shot Composed Image
Retrieval [84.11127588805138]
Composed Image Retrieval (CIR)は、クエリイメージとテキストを組み合わせて、対象とするターゲットを記述する。
既存の方法は、クエリ画像、テキスト仕様、ターゲット画像からなるラベル付き三重項を用いたCIRモデルの教師あり学習に依存している。
我々は,ラベル付き三重項学習を必要とせずにCIRモデルを構築することを目的として,Zero-Shot Composed Image Retrieval (ZS-CIR)を提案する。
論文 参考訳(メタデータ) (2023-02-06T19:40:04Z) - COFAR: Commonsense and Factual Reasoning in Image Search [2.6354148238224697]
現代の人工知能モデルよりも人間を優越させる特徴の1つは、視覚的に明らかなもの以上の画像を解釈できる能力である。
我々は、画像内の名前付き視覚的エンティティを百科事典知識のゲートウェイとして扱う、知識検索拡張マルチモーダルトランス(KRAMT)という統合されたフレームワークを提案する。
この統合されたフレームワークは、コモンセンスと事実推論を必要とする画像検索を実行するために使用される。
論文 参考訳(メタデータ) (2022-10-16T14:43:13Z) - ARTEMIS: Attention-based Retrieval with Text-Explicit Matching and
Implicit Similarity [16.550790981646276]
現在のアプローチでは、クエリの2つの要素のそれぞれの特徴をひとつの表現にまとめています。
本研究の目的は,テキスト・ツー・イメージ検索と画像・ツー・イメージ検索という,慣れ親しんだ2つのフレームワークのプリズムを通じてタスクに新たな光を当てることである。
論文 参考訳(メタデータ) (2022-03-15T17:29:20Z) - An Effective and Robust Detector for Logo Detection [58.448716977297565]
一部の攻撃者は、よく訓練されたロゴ検出モデルを侵害で騙している。
本稿では,2回検討する機構に基づく新しいロゴ検出手法を提案する。
我々は,デテクトRSアルゴリズムを,等化損失関数,マルチスケール変換,および逆データ拡張を備えたカスケードスキーマに拡張する。
論文 参考訳(メタデータ) (2021-08-01T10:17:53Z) - Tasks Integrated Networks: Joint Detection and Retrieval for Image
Search [99.49021025124405]
多くの現実世界の探索シナリオ(例えばビデオ監視)では、オブジェクトは正確に検出または注釈付けされることはめったにない。
まず、エンド・ツー・エンド統合ネット(I-Net)を紹介します。
さらに,2つの新しいコントリビューションを行うDC-I-Netという改良されたI-Netを提案する。
論文 参考訳(メタデータ) (2020-09-03T03:57:50Z) - Apparel-invariant Feature Learning for Apparel-changed Person
Re-identification [70.16040194572406]
ほとんどのパブリックなReIDデータセットは、人の外観がほとんど変化しない短時間のウィンドウで収集される。
ショッピングモールのような現実世界の応用では、同じ人の服装が変化し、異なる人が同様の服を着ることがある。
着替えなどの場合や、類似の服を着ている場合などにおいて、アパレル不変の人物表現を学ぶことは極めて重要である。
論文 参考訳(メタデータ) (2020-08-14T03:49:14Z) - Adaptive Semantic-Visual Tree for Hierarchical Embeddings [67.01307058209709]
本稿では,商品カテゴリのアーキテクチャを記述するために,階層型適応型セマンティックビジュアルツリーを提案する。
この木は、異なる意味レベルと同じ意味クラス内の視覚的類似度を同時に評価する。
各レベルにおいて、セマンティック階層に基づいて異なるマージンを設定し、それらを事前情報として組み込んで、きめ細かい機能埋め込みを学習する。
論文 参考訳(メタデータ) (2020-03-08T03:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。