論文の概要: From Pixels to Purchase: Building and Evaluating a Taxonomy-Decoupled Visual Search Engine for Home Goods E-commerce
- arxiv url: http://arxiv.org/abs/2601.11769v1
- Date: Fri, 16 Jan 2026 20:54:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.314416
- Title: From Pixels to Purchase: Building and Evaluating a Taxonomy-Decoupled Visual Search Engine for Home Goods E-commerce
- Title(参考訳): スマートフォンから購入へ:家庭のEコマースのための分類分離ビジュアル検索エンジンの構築と評価
- Authors: Cheng Lyu, Jingyue Zhang, Ryan Maunu, Mengwei Li, Vinny DeGenova, Yuanli Pei,
- Abstract要約: ビジュアル検索は、特にユーザ意図が主観的でオープンなスタイル駆動のドメインにおいて、電子商取引において重要である。
分類自由領域の提案と類似性検索のための統合埋め込みを用いた分類分離アーキテクチャを提案する。
我々のシステムでは、検索品質を改善し、顧客エンゲージメントの計測可能なアップリフトを得られる一方、オフライン評価の指標は現実世界の結果と強く相関する。
- 参考スコア(独自算出の注目度): 6.200631104634354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual search is critical for e-commerce, especially in style-driven domains where user intent is subjective and open-ended. Existing industrial systems typically couple object detection with taxonomy-based classification and rely on catalog data for evaluation, which is prone to noise that limits robustness and scalability. We propose a taxonomy-decoupled architecture that uses classification-free region proposals and unified embeddings for similarity retrieval, enabling a more flexible and generalizable visual search. To overcome the evaluation bottleneck, we propose an LLM-as-a-Judge framework that assesses nuanced visual similarity and category relevance for query-result pairs in a zero-shot manner, removing dependence on human annotations or noise-prone catalog data. Deployed at scale on a global home goods platform, our system improves retrieval quality and yields a measurable uplift in customer engagement, while our offline evaluation metrics strongly correlate with real-world outcomes.
- Abstract(参考訳): ビジュアル検索は、特にユーザ意図が主観的でオープンなスタイル駆動のドメインにおいて、電子商取引において重要である。
既存の産業システムは通常、分類に基づく分類とオブジェクト検出を結合し、評価のためにカタログデータに依存する。
分類自由領域の提案と類似性検索のための統合埋め込みを利用して、より柔軟で一般化可能な視覚検索を可能にする分類分離アーキテクチャを提案する。
評価ボトルネックを克服するため,ゼロショット方式で問合せ型ペアの視覚的類似度とカテゴリ関連性を評価し,人間のアノテーションやノイズに起因したカタログデータへの依存を除去するLLM-as-a-Judgeフレームワークを提案する。
グローバルなホームグッズプラットフォームに大規模に展開するシステムでは,検索品質が向上し,顧客のエンゲージメントが向上する一方,オフライン評価指標は実世界の成果と強く相関する。
関連論文リスト
- UniDGF: A Unified Detection-to-Generation Framework for Hierarchical Object Visual Recognition [14.256812146187565]
本稿では,階層的カテゴリと属性トークンを予測可能な検出誘導型生成フレームワークを提案する。
検出対象ごとに、精細なROIレベルの特徴を抽出し、BARTベースのジェネレータを用いて意味トークンを生成する。
大規模なプロプライエタリなeコマースデータセットとオープンソースデータセットの両方の実験は、我々のアプローチが既存の類似性ベースのパイプラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2025-11-20T02:37:43Z) - Taxonomy-based Negative Sampling In Personalized Semantic Search for E-commerce [46.251483528080236]
本稿では,クエリや商品を共有ベクトル空間に埋め込んだeコマース検索のセマンティック検索モデルを提案する。
顧客の過去の購買履歴と行動をモデル化し,ユーザレベルのパーソナライゼーションを取り入れた。
論文 参考訳(メタデータ) (2025-11-01T20:25:00Z) - Improving E-commerce Search with Category-Aligned Retrieval [0.0]
カテゴリー対応検索システム(CARS)は,まずユーザのクエリから製品カテゴリを予測し,そのカテゴリ内で製品を強化することによって,検索関連性を向上させる。
本稿では,クエリの埋め込みから"Trainable Category Prototypes"を作成する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-09-03T20:43:52Z) - Zero-Shot Retrieval for Scalable Visual Search in a Two-Sided Marketplace [0.0]
本稿では,MercuriのC2Cマーケットプレースに展開するスケーラブルなビジュアルサーチシステムを提案する。
我々は、ゼロショット画像検索のための最近の視覚言語モデルを評価し、その性能を既存の微調整ベースラインと比較する。
論文 参考訳(メタデータ) (2025-07-31T05:13:20Z) - SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - Multi-output Headed Ensembles for Product Item Classification [0.9053163124987533]
本稿では,eコマースカタログを対象としたディープラーニングに基づく分類モデルフレームワークを提案する。
我々は、ロバストな業界標準ベースラインモデルに対する改善を示す。
また,ユーザセッションを用いたモデル性能評価手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T01:23:36Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - CRACT: Cascaded Regression-Align-Classification for Robust Visual
Tracking [97.84109669027225]
改良された提案改良モジュールCascaded Regression-Align- Classification (CRAC)を導入する。
CRACは多くのベンチマークで最先端のパフォーマンスを得る。
OTB-2015、UAV123、NfS、VOT-2018、TrackingNet、GOT-10k、LaSOTを含む7つのベンチマークの実験において、我々のCRACTは最先端の競合他社と比較して非常に有望な結果を示している。
論文 参考訳(メタデータ) (2020-11-25T02:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。