論文の概要: Search By Image: Deeply Exploring Beneficial Features for Beauty Product
Retrieval
- arxiv url: http://arxiv.org/abs/2303.14075v1
- Date: Fri, 24 Mar 2023 15:38:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 14:01:23.027233
- Title: Search By Image: Deeply Exploring Beneficial Features for Beauty Product
Retrieval
- Title(参考訳): 画像による検索:美容品検索に便利な機能を探る
- Authors: Mingqiang Wei, Qian Sun, Haoran Xie, Dong Liang, Fu Lee Wang
- Abstract要約: 本稿では,ニューラルネットワークによる美容積検索(BPR)の実用的意義について検討する。
我々は様々な種類の画像の特徴を抽出し、これらの特徴がiにとって有益かどうかという興味深い疑問を提起する。
美容製品画像の複数特徴(VM-Net)の組み合わせを理解するために,新しい可変アテンションニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 21.78262478923889
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Searching by image is popular yet still challenging due to the extensive
interference arose from i) data variations (e.g., background, pose, visual
angle, brightness) of real-world captured images and ii) similar images in the
query dataset. This paper studies a practically meaningful problem of beauty
product retrieval (BPR) by neural networks. We broadly extract different types
of image features, and raise an intriguing question that whether these features
are beneficial to i) suppress data variations of real-world captured images,
and ii) distinguish one image from others which look very similar but are
intrinsically different beauty products in the dataset, therefore leading to an
enhanced capability of BPR. To answer it, we present a novel variable-attention
neural network to understand the combination of multiple features (termed
VM-Net) of beauty product images. Considering that there are few publicly
released training datasets for BPR, we establish a new dataset with more than
one million images classified into more than 20K categories to improve both the
generalization and anti-interference abilities of VM-Net and other methods. We
verify the performance of VM-Net and its competitors on the benchmark dataset
Perfect-500K, where VM-Net shows clear improvements over the competitors in
terms of MAP@7. The source code and dataset will be released upon publication.
- Abstract(参考訳): 画像による検索は人気があるが、広範にわたる干渉により依然として難しい。
一 実世界の撮影画像のデータ変動(背景、ポーズ、視角、明るさ等)
ii) クエリデータセットに類似した画像。
本稿では,ニューラルネットワークによる美容積検索(BPR)の実用的意義について検討する。
異なるタイプの画像特徴を幅広く抽出し、これらの特徴が有用かどうかという興味深い疑問を提起する。
一 実世界撮影画像のデータ変動を抑制すること、及び
二 非常によく似ているが、本質的に異なる美容製品である他の画像とを区別することにより、BPRの能力が向上する。
そこで本研究では,美しい製品画像の複数の特徴(VM-Net)の組み合わせを理解するために,新しい可変アテンションニューラルネットワークを提案する。
BPRのトレーニングデータセットが公開されていないことを考えると、100万以上の画像を20K以上のカテゴリに分類した新しいデータセットを構築し、VM-Netや他の手法の一般化と干渉防止の両方を改善する。
我々はvm-netとその競合製品のパフォーマンスをベンチマークデータセットperfect-500kで検証する。
ソースコードとデータセットは公開時にリリースされる。
関連論文リスト
- A Multimodal Approach for Cross-Domain Image Retrieval [6.24302896438145]
本稿では、生成した画像のコレクションを検査するための追加ツールとして使用できるCDIR(Cross-Domain Image Retrieval)に焦点を当てる。
理想的な検索システムは、複数の領域から見えない複雑な画像を一般化することができる。
本稿では,大規模データセット上で事前学習したマルチモーダル言語ビジョンアーキテクチャを活用する新しいキャプションマッチング手法を提案する。
論文 参考訳(メタデータ) (2024-03-22T12:08:16Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - JourneyDB: A Benchmark for Generative Image Understanding [89.02046606392382]
生成画像の領域に適合する包括的データセットであるJourneyDBを導入する。
精巧にキュレートされたデータセットは、400万の異なる高品質な画像で構成されています。
本データセットでは,生成した画像の理解性能を評価するための4つのベンチマークを考案した。
論文 参考訳(メタデータ) (2023-07-03T02:39:08Z) - Improving Image Recognition by Retrieving from Web-Scale Image-Text Data [68.63453336523318]
本稿では,メモリから抽出した各サンプルの重要性を学習するアテンションベースのメモリモジュールを提案する。
既存の手法と比較して,提案手法は無関係な検索例の影響を排除し,入力クエリに有益であるものを保持する。
我々は、ImageNet-LT、Places-LT、Webvisionのデータセットで最先端の精度を実現していることを示す。
論文 参考訳(メタデータ) (2023-04-11T12:12:05Z) - Towards Robustness of Neural Networks [0.0]
我々は、画像Net-A/O と ImageNet-R と、合成環境とテストスイートである CAOS を紹介した。
すべてのデータセットは、ロバストネスのテストとロバストネスの進捗測定のために作成されました。
我々は、単純なベースラインを最大ロジット、典型スコアの形式で構築するとともに、DeepAugmentの形式で新しいデータ拡張手法を作成します。
論文 参考訳(メタデータ) (2021-12-30T19:41:10Z) - Detection and Localization of Multiple Image Splicing Using MobileNet V1 [0.0]
2つ以上の画像を組み合わせて、ソーシャルメディアプラットフォーム間で情報を伝達できる新しい画像を生成する。
本研究では,Mask R-CNNを用いた複数画像スプライシングの偽造検出手法を提案する。
また、複数のスプライシング画像の鍛造領域のパーセンテージスコアを算出する。
論文 参考訳(メタデータ) (2021-08-22T09:27:22Z) - AugNet: End-to-End Unsupervised Visual Representation Learning with
Image Augmentation [3.6790362352712873]
我々は、未ラベル画像の集合から画像特徴を学習するための新しいディープラーニングトレーニングパラダイムであるAugNetを提案する。
実験により,低次元空間における画像の表現が可能であることを実証した。
多くのディープラーニングベースの画像検索アルゴリズムとは異なり、我々のアプローチは外部アノテーション付きデータセットへのアクセスを必要としない。
論文 参考訳(メタデータ) (2021-06-11T09:02:30Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - Real-MFF: A Large Realistic Multi-focus Image Dataset with Ground Truth [58.226535803985804]
我々はReal-MFFと呼ばれる大規模で現実的なマルチフォーカスデータセットを導入する。
データセットは、710対のソースイメージと対応する接地真理画像を含む。
このデータセット上で10の典型的なマルチフォーカスアルゴリズムを図示のために評価する。
論文 参考訳(メタデータ) (2020-03-28T12:33:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。