論文の概要: LookSync: Large-Scale Visual Product Search System for AI-Generated Fashion Looks
- arxiv url: http://arxiv.org/abs/2511.00072v1
- Date: Wed, 29 Oct 2025 12:30:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.560751
- Title: LookSync: Large-Scale Visual Product Search System for AI-Generated Fashion Looks
- Title(参考訳): LookSync:AI生成ファッションルックのための大規模ビジュアルプロダクト検索システム
- Authors: Pradeep M, Ritesh Pallod, Satyen Abrol, Muthu Raman, Ian Anderson,
- Abstract要約: 本稿では,AI生成された外観が,インデックス付きベクトル空間から最も視覚的に,意味的に類似した製品と一致することを保証する,エンドツーエンドの製品検索システムを提案する。
現在、このシステムは1日あたり35万件以上のAIルックを提供しており、全世界の製品カテゴリーで1200万以上のプロダクトをカバーしている。
- 参考スコア(独自算出の注目度): 0.6328726446929896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative AI is reshaping fashion by enabling virtual looks and avatars making it essential to find real products that best match AI-generated styles. We propose an end-to-end product search system that has been deployed in a real-world, internet scale which ensures that AI-generated looks presented to users are matched with the most visually and semantically similar products from the indexed vector space. The search pipeline is composed of four key components: query generation, vectorization, candidate retrieval, and reranking based on AI-generated looks. Recommendation quality is evaluated using human-judged accuracy scores. The system currently serves more than 350,000 AI Looks in production per day, covering diverse product categories across global markets of over 12 million products. In our experiments, we observed that across multiple annotators and categories, CLIP outperformed alternative models by a small relative margin of 3--7\% in mean opinion scores. These improvements, though modest in absolute numbers, resulted in noticeably better user perception matches, establishing CLIP as the most reliable backbone for production deployment.
- Abstract(参考訳): ジェネレーティブAIは、仮想的なルック&アバターを可能にして、AI生成スタイルに最適な製品を見つけることが不可欠である、というファッションを変革している。
実世界のインターネット規模で展開されたエンドツーエンドの製品検索システムを提案する。これにより,ユーザに対して提示されたAI生成された外観が,インデックス付きベクトル空間から得られる最も視覚的かつ意味的に類似した製品とマッチングされることが保証される。
検索パイプラインは、クエリ生成、ベクトル化、候補検索、AI生成されたルックに基づく再ランクの4つの重要なコンポーネントで構成されている。
ヒトの判断精度スコアを用いて推薦品質を評価する。
現在、このシステムは1日あたり35万件以上のAIルックを提供しており、全世界の製品カテゴリーで1200万以上のプロダクトをカバーしている。
実験の結果,複数のアノテータやカテゴリにおいて,CLIPは平均世論スコアの3~7倍の差で,代替モデルよりも優れていた。
これらの改善は絶対数では控え目なものだったが、ユーザ認識の整合性が著しく向上し、運用デプロイメントの最も信頼性の高いバックボーンとしてCLIPを確立した。
関連論文リスト
- OneVision: An End-to-End Generative Framework for Multi-view E-commerce Vision Search [23.65549831170715]
OneVisionは、視覚検索のためのエンドツーエンドの生成フレームワークである。
OneVisionは、視覚対応の残留量子化符号化であるVRQ上に構築されている。
オフライン評価では、OneVisionはオンラインMCAと同等に動作し、推論効率を21%向上させる。
論文 参考訳(メタデータ) (2025-10-07T10:25:21Z) - Bridging the Gap Between Ideal and Real-world Evaluation: Benchmarking AI-Generated Image Detection in Challenging Scenarios [54.07895223545793]
本稿では,実世界ロバストネスデータセット(RRDataset)を導入し,3次元にわたる検出モデルの包括的評価を行う。
RRDatasetには7つの主要なシナリオの高品質なイメージが含まれている。
我々はRRDataset上で17の検出器と10の視覚言語モデル(VLM)をベンチマークし、大規模な人間実験を行った。
論文 参考訳(メタデータ) (2025-09-11T06:15:52Z) - UniSearch: Rethinking Search System with a Unified Generative Architecture [20.448690421956023]
UniSearchはKuaishou Searchのための統合された生成検索フレームワークである。
UniSearchは、カスケードパイプラインを、検索ジェネレータとビデオジェネレータを統合するエンドツーエンドアーキテクチャに置き換える。
産業規模のデータセットに関する大規模な実験と、短いビデオとライブ検索のシナリオにおけるオンラインA/Bテストは、UniSearchの強力な有効性とデプロイメントの可能性を示している。
論文 参考訳(メタデータ) (2025-09-08T17:08:26Z) - OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.94443394870866]
OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。
OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。
このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文 参考訳(メタデータ) (2025-09-03T11:50:04Z) - Zero-Shot Retrieval for Scalable Visual Search in a Two-Sided Marketplace [0.0]
本稿では,MercuriのC2Cマーケットプレースに展開するスケーラブルなビジュアルサーチシステムを提案する。
我々は、ゼロショット画像検索のための最近の視覚言語モデルを評価し、その性能を既存の微調整ベースラインと比較する。
論文 参考訳(メタデータ) (2025-07-31T05:13:20Z) - Quality Assessment and Distortion-aware Saliency Prediction for AI-Generated Omnidirectional Images [70.49595920462579]
本研究は,AIGODIの品質評価と歪みを考慮したサリエンシ予測問題について検討する。
BLIP-2モデルに基づく共有エンコーダを用いた2つのモデルを提案する。
論文 参考訳(メタデータ) (2025-06-27T05:36:04Z) - DeepShop: A Benchmark for Deep Research Shopping Agents [70.03744154560717]
DeepShopは、複雑なリアルなオンラインショッピング環境でWebエージェントを評価するために設計されたベンチマークである。
5つの人気のあるオンラインショッピングドメインに多様なクエリを生成します。
エージェントの性能をきめ細かな面から評価する自動評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-03T13:08:17Z) - 3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models [94.48803082248872]
3D世代は急速に進歩しているが、3D評価の開発はペースを保っていない。
3DGen-Arenaは、公開ユーザと専門家アノテータの両方から人間の好みを収集する統合プラットフォームである。
このデータセットを用いて、CLIPベースのスコアモデルである3DGen-ScoreとMLLMベースの自動評価器である3DGen-Evalをさらに訓練する。
論文 参考訳(メタデータ) (2025-03-27T17:53:00Z) - Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models [51.067146460271466]
視覚生成モデルの評価には時間を要するし、計算コストもかかる。
本研究では,効率的,動的,多ラウンドな評価に人間的な戦略を用いる評価エージェントフレームワークを提案する。
1)効率性、2)多様なユーザニーズに合わせた迅速な評価、3)1つの数値スコア以上の説明可能性、4)さまざまなモデルやツールのスケーラビリティ。
論文 参考訳(メタデータ) (2024-12-10T18:52:39Z) - Where are we in the search for an Artificial Visual Cortex for Embodied
Intelligence? [106.81451807227103]
Embodied AIのための、事前訓練された視覚表現(PVR)や視覚的「基礎モデル」に関する、最大かつ最も包括的な実証研究を提示する。
事前学習したデータサイズと多様性の効果を調べるため、7つの異なるソースから4000時間以上のエゴセントリックなビデオを合成する。
当社の最大のモデルであるVC-1は、従来のPVRを平均で上回っているが、どちらも支配的ではない。
論文 参考訳(メタデータ) (2023-03-31T17:56:33Z) - eProduct: A Million-Scale Visual Search Benchmark to Address Product
Recognition Challenges [8.204924070199866]
eProductは、実世界のさまざまなビジュアル検索ソリューションのトレーニングと評価のためのベンチマークデータセットである。
本稿では,eProductをトレーニングセットと評価セットとして提示し,トレーニングセットには1.3M+のタイトル付き画像と階層的カテゴリラベルが記載されている。
本稿では,eProductの構成手順,多様性の分析,トレーニングしたベースラインモデルの性能について紹介する。
論文 参考訳(メタデータ) (2021-07-13T05:28:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。