論文の概要: An Effective Pipeline for a Real-world Clothes Retrieval System
- arxiv url: http://arxiv.org/abs/2005.12739v1
- Date: Tue, 26 May 2020 14:08:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 23:57:26.435769
- Title: An Effective Pipeline for a Real-world Clothes Retrieval System
- Title(参考訳): 実世界の衣服検索システムのための効果的なパイプライン
- Authors: Yang-Ho Ji, HeeJae Jun, Insik Kim, Jongtack Kim, Youngjoon Kim,
Byungsoo Ko, Hyong-Keun Kook, Jingeun Lee, Sangwon Lee, Sanghyuk Park
- Abstract要約: 提案手法は,検出,検索,後処理の3つのコンポーネントから構成される。
提案手法により、DeepFashion2 Clothes Retrieval 2020チャレンジで2位を獲得しました。
- 参考スコア(独自算出の注目度): 8.057752219754125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose an effective pipeline for clothes retrieval system
which has sturdiness on large-scale real-world fashion data. Our proposed
method consists of three components: detection, retrieval, and post-processing.
We firstly conduct a detection task for precise retrieval on target clothes,
then retrieve the corresponding items with the metric learning-based model. To
improve the retrieval robustness against noise and misleading bounding boxes,
we apply post-processing methods such as weighted boxes fusion and feature
concatenation. With the proposed methodology, we achieved 2nd place in the
DeepFashion2 Clothes Retrieval 2020 challenge.
- Abstract(参考訳): 本稿では,大規模実世界のファッションデータに頑健性を有する着物検索システムのための効果的なパイプラインを提案する。
提案手法は,検出,検索,後処理の3成分からなる。
まず,対象の衣服を正確に検索するための検出タスクを行い,それに対応する項目を計量学習モデルで検索する。
重み付きボックス融合や特徴連結といった後処理手法を応用し,ノイズに対する検索の堅牢性の向上とバウンディングボックスの誤解を招く。
提案手法により、DeepFashion2 Clothes Retrieval 2020チャレンジで2位を獲得しました。
関連論文リスト
- SemanticTopoLoop: Semantic Loop Closure With 3D Topological Graph Based
on Quadric-Level Object Map [0.8158530638728501]
ループクロージャはSLAMの重要なコンポーネントの1つです。
バッグ・オブ・ワード(英語版)モデルのような伝統的な外見に基づく手法は、しばしば局所的な2D特徴とトレーニングデータの量によって制限される。
論文 参考訳(メタデータ) (2023-11-06T02:30:30Z) - A Topological Machine Learning Pipeline for Classification [3.123049150077741]
本研究では, パーシステンス図とデジタルデータを関連付けるパイプラインを, 検討対象データに対して最も適切なフィルタによって構築する。
この作業は、永続的ホモロジーと機械学習を使用したデータ分類のための、簡単かつ使いやすいパイプラインへの第一歩である。
論文 参考訳(メタデータ) (2023-09-26T21:29:07Z) - Adaptive Cross Batch Normalization for Metric Learning [75.91093210956116]
メトリクス学習はコンピュータビジョンの基本的な問題である。
蓄積した埋め込みが最新であることを保証することは、同様に重要であることを示す。
特に、蓄積した埋め込みと現在のトレーニングイテレーションにおける特徴埋め込みとの間の表現的ドリフトを回避する必要がある。
論文 参考訳(メタデータ) (2023-03-30T03:22:52Z) - A Triplet-loss Dilated Residual Network for High-Resolution
Representation Learning in Image Retrieval [0.0]
ローカライゼーションなどのいくつかのアプリケーションでは、画像検索が最初のステップとして使用される。
本論文では,トレーニング可能なパラメータが少ない,単純かつ効率的な画像検索システムを提案する。
提案手法は三重項損失を有する拡張残差畳み込みニューラルネットワークの利点である。
論文 参考訳(メタデータ) (2023-03-15T07:01:44Z) - Approximate Nearest Neighbor Search under Neural Similarity Metric for
Large-Scale Recommendation [20.42993976179691]
本稿では,任意のマッチング関数にANN探索を拡張する新しい手法を提案する。
我々の主な考えは、すべての項目から構築された類似性グラフに一致する関数で、欲張りのウォークを実行することである。
提案手法は,Taobaoのディスプレイ広告プラットフォームに完全に展開されており,広告収入の大幅な増加をもたらす。
論文 参考訳(メタデータ) (2022-02-14T07:55:57Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Integrating Semantics and Neighborhood Information with Graph-Driven
Generative Models for Document Retrieval [51.823187647843945]
本稿では,周辺情報をグラフ誘導ガウス分布でエンコードし,その2種類の情報をグラフ駆動生成モデルと統合することを提案する。
この近似の下では、トレーニング対象がシングルトンまたはペアワイズ文書のみを含む用語に分解可能であることを証明し、モデルが非関連文書と同じくらい効率的にトレーニングできることを示す。
論文 参考訳(メタデータ) (2021-05-27T11:29:03Z) - Towards an efficient framework for Data Extraction from Chart Images [27.114170963444074]
データマイニングシステムにおいて,データ抽出段階において最先端のコンピュータビジョン技術を採用する。
堅牢な点検出器を構築するには、特徴融合モジュールを備えた完全な畳み込みネットワークを採用する。
データ変換では,検出した要素を意味値でデータに変換する。
論文 参考訳(メタデータ) (2021-05-05T13:18:53Z) - LoRD-Net: Unfolded Deep Detection Network with Low-Resolution Receivers [104.01415343139901]
本稿では,1ビット計測から情報シンボルを復元する「LoRD-Net」というディープ検出器を提案する。
LoRD-Netは、関心のシグナルを回復するためのタスクベースのアーキテクチャである。
無線通信における1ビット信号回復のためのレシーバアーキテクチャの評価を行った。
論文 参考訳(メタデータ) (2021-02-05T04:26:05Z) - Finding Action Tubes with a Sparse-to-Dense Framework [62.60742627484788]
本稿では,ビデオストリームからのアクションチューブ提案を1つのフォワードパスでスパース・トゥ・デンス方式で生成するフレームワークを提案する。
UCF101-24, JHMDB-21, UCFSportsベンチマークデータセット上で, 本モデルの有効性を評価する。
論文 参考訳(メタデータ) (2020-08-30T15:38:44Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。