論文の概要: Large-Scale Product Retrieval with Weakly Supervised Representation
Learning
- arxiv url: http://arxiv.org/abs/2208.00955v1
- Date: Mon, 1 Aug 2022 16:05:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 14:03:36.755324
- Title: Large-Scale Product Retrieval with Weakly Supervised Representation
Learning
- Title(参考訳): 弱教師付き表現学習による大規模製品検索
- Authors: Xiao Han, Kam Woh Ng, Sauradip Nag, Zhiyu Qu
- Abstract要約: 本稿では,CVPR 2022のFGVC9ワークショップで開催されるeBay Visual Search Challenge(eProduct)の新たなソリューションを紹介する。
71.53%のMARを達成することで、私たちのソリューションである"Involution King"がリーダーボードの第2位を獲得します。
- 参考スコア(独自算出の注目度): 8.038297704332994
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale weakly supervised product retrieval is a practically useful yet
computationally challenging problem. This paper introduces a novel solution for
the eBay Visual Search Challenge (eProduct) held at the Ninth Workshop on
Fine-Grained Visual Categorisation workshop (FGVC9) of CVPR 2022. This
competition presents two challenges: (a) E-commerce is a drastically
fine-grained domain including many products with subtle visual differences; (b)
A lacking of target instance-level labels for model training, with only coarse
category labels and product titles available. To overcome these obstacles, we
formulate a strong solution by a set of dedicated designs: (a) Instead of using
text training data directly, we mine thousands of pseudo-attributes from
product titles and use them as the ground truths for multi-label
classification. (b) We incorporate several strong backbones with advanced
training recipes for more discriminative representation learning. (c) We
further introduce a number of post-processing techniques including whitening,
re-ranking and model ensemble for retrieval enhancement. By achieving 71.53%
MAR, our solution "Involution King" achieves the second position on the
leaderboard.
- Abstract(参考訳): 大規模弱教師付き製品検索は実用上有用だが計算上難しい問題である。
本稿では,cvpr 2022の細粒度視覚分類ワークショップ(fgvc9)第9回ワークショップにおいて,ebay visual search challenge (eproduct) の新たなソリューションを提案する。
この競争には2つの課題がある。
(a)Eコマースは、微妙な視覚的差異のある多くの製品を含む、非常にきめ細かなドメインである。
b) モデルトレーニング対象のインスタンスレベルラベルが不足しており、粗いカテゴリラベルと製品タイトルのみが利用可能である。
これらの障害を克服するために、我々は一連の専用設計によって強い解を定式化する。
(a)テキストトレーニングデータを直接使用する代わりに、製品タイトルから何千もの擬似属性を抽出し、マルチラベル分類の土台として利用する。
(b)より識別的な表現学習のための高度なトレーニングレシピにいくつかの強力なバックボーンを組み込んだ。
(c) 検索強化のためのホワイトニング, 再ランク付け, モデルアンサンブルなど, 多数の後処理技術を紹介する。
71.53%のMARを達成することで、私たちのソリューションである"Involution King"がリーダーボードの第2位を獲得します。
関連論文リスト
- UniDEC : Unified Dual Encoder and Classifier Training for Extreme Multi-Label Classification [42.36546066941635]
Extreme Multi-label Classification (XMC) は非常に大きなラベル空間から関連するラベルのサブセットを予測する。
この研究は、デュアルエンコーダと分類器を同時に訓練する新しいエンドツーエンドのトレーニング可能なフレームワークであるUniDECを提案する。
論文 参考訳(メタデータ) (2024-05-04T17:27:51Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Multimodal Prompt Learning for Product Title Generation with Extremely
Limited Labels [66.54691023795097]
本稿では,ラベルが限定された新商品のタイトルを生成するためのプロンプトベースアプローチ,すなわちマルチモーダル・プロンプト学習フレームワークを提案する。
我々は、新しい製品の対応する特性と書体を維持するために、異なるモダリティから多モーダルなプロンプトのセットを構築する。
トレーニング用ラベル付きデータの完全化により,本手法は最先端の結果が得られる。
論文 参考訳(メタデータ) (2023-07-05T00:40:40Z) - ZhichunRoad at Amazon KDD Cup 2022: MultiTask Pre-Training for
E-Commerce Product Search [4.220439000486713]
検索結果の質を向上させるために,頑健な多言語モデルを提案する。
事前学習の段階では、mlmタスク、分類タスク、コントラスト学習タスクを採用する。
微調整段階では、自信ある学習、指数的移動平均法(EMA)、対人訓練(FGM)、正規化ドロップアウト戦略(R-Drop)を用いる。
論文 参考訳(メタデータ) (2023-01-31T07:31:34Z) - Automatically Discovering Novel Visual Categories with Self-supervised
Prototype Learning [68.63910949916209]
本稿では,大規模な画像収集において未知のカテゴリを識別することを目的とした,新しいカテゴリ発見(NCD)の課題に取り組む。
本稿では,プロトタイプ表現学習とプロトタイプ自己学習という,2つの主要な段階からなる適応型プロトタイプ学習手法を提案する。
本研究では,4つのベンチマークデータセットについて広範な実験を行い,提案手法の有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-08-01T16:34:33Z) - e-CLIP: Large-Scale Vision-Language Representation Learning in
E-commerce [9.46186546774799]
本研究では,未ラベルの製品テキストや画像を用いて,言語モデルと視覚モデルとを整合させるコントラスト学習フレームワークを提案する。
我々は、大規模表現学習モデルを訓練し、ドメイン固有の課題に対処するソリューションを共有するために使用したテクニックを提示する。
論文 参考訳(メタデータ) (2022-07-01T05:16:47Z) - Advances in MetaDL: AAAI 2021 challenge and workshop [0.0]
本稿では,課題の設計とその成果について述べるとともに,ワークショップで行ったプレゼンテーションを要約する。
この課題は、小さな画像の少人数の学習分類タスクに焦点をあてた。
勝利の方法は、人気のあるCNNバックボーンの2番目の層でトレーニングされた様々な分類器を備え、メタトレーニングデータに基づいて微調整され、ラベル付きサポートでトレーニングされ、メタテストデータのラベル付きクエリセットでテストされた。
論文 参考訳(メタデータ) (2022-02-01T07:46:36Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Visual Transformer for Task-aware Active Learning [49.903358393660724]
プールベースのアクティブラーニングのための新しいパイプラインを提案する。
提案手法は,学習中に使用可能なアンラベリング例を利用して,ラベル付き例との相関関係を推定する。
ビジュアルトランスフォーマーは、ラベル付き例と非ラベル付き例の間の非ローカルビジュアル概念依存性をモデル化する。
論文 参考訳(メタデータ) (2021-06-07T17:13:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。