論文の概要: On Background Bias in Deep Metric Learning
- arxiv url: http://arxiv.org/abs/2210.01615v1
- Date: Tue, 4 Oct 2022 13:57:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 15:18:14.160059
- Title: On Background Bias in Deep Metric Learning
- Title(参考訳): 深層学習における背景バイアスについて
- Authors: Konstantin Kobs and Andreas Hotho
- Abstract要約: 画像背景がDeep Metric Learningモデルに与える影響を分析する。
トレーニング中の画像の背景をランダムな背景画像に置き換えることでこの問題が軽減されることを示す。
- 参考スコア(独自算出の注目度): 5.368313160283353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Metric Learning trains a neural network to map input images to a
lower-dimensional embedding space such that similar images are closer together
than dissimilar images. When used for item retrieval, a query image is embedded
using the trained model and the closest items from a database storing their
respective embeddings are returned as the most similar items for the query.
Especially in product retrieval, where a user searches for a certain product by
taking a photo of it, the image background is usually not important and thus
should not influence the embedding process. Ideally, the retrieval process
always returns fitting items for the photographed object, regardless of the
environment the photo was taken in. In this paper, we analyze the influence of
the image background on Deep Metric Learning models by utilizing five common
loss functions and three common datasets. We find that Deep Metric Learning
networks are prone to so-called background bias, which can lead to a severe
decrease in retrieval performance when changing the image background during
inference. We also show that replacing the background of images during training
with random background images alleviates this issue. Since we use an automatic
background removal method to do this background replacement, no additional
manual labeling work and model changes are required while inference time stays
the same. Qualitative and quantitative analyses, for which we introduce a new
evaluation metric, confirm that models trained with replaced backgrounds attend
more to the main object in the image, benefitting item retrieval systems.
- Abstract(参考訳): Deep Metric Learningはニューラルネットワークを使って、入力された画像を、類似した画像が異種画像よりも近いように、低次元の埋め込み空間にマッピングする。
アイテム検索に使用する場合、トレーニングされたモデルを用いてクエリイメージを埋め込み、各埋め込みを格納するデータベースから最も近いアイテムをクエリの最も類似したアイテムとして返却する。
特に製品検索では、ユーザーが写真を撮って特定の商品を検索する場合、画像の背景は重要ではなく、そのため埋め込みプロセスに影響を与えるべきではない。
理想的には、検索プロセスは、写真が撮影された環境に関係なく、常に被写体に適したアイテムを返す。
本稿では,5つの共通損失関数と3つの共通データセットを用いて,画像背景がディープラーニングモデルに与える影響を分析する。
我々は,Deep Metric Learning Networkは背景バイアスと呼ばれる傾向があり,推論中に画像背景を変更する際に,検索性能が著しく低下することを発見した。
また,トレーニング中の画像の背景をランダムな背景画像に置き換えることにより,この問題が軽減されることを示す。
背景の置き換えには背景の自動削除手法を使用するため、推論時間が同じである間、追加の手動ラベリング作業やモデル変更は不要である。
新しい評価基準を導入する定性的および定量的分析により、画像の主対象に置換背景で訓練されたモデルがより深く参加し、アイテム検索システムに有利であることを確認した。
関連論文リスト
- Targeted Background Removal Creates Interpretable Feature Visualizations [0.0]
我々は、背景除去技法を堅牢なトレーニングの形式として利用することにより、ネットワークはより人間に認識可能な特徴を学習せざるを得ない、と論じる。
この仮説を検証するために4つの異なる訓練方法が用いられた。
特徴視覚化の結果,背景除去画像はベースラインモデルよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2023-06-22T19:39:06Z) - Query Semantic Reconstruction for Background in Few-Shot Segmentation [0.0]
Few-shot segmentation (FSS) は、いくつかのアノテーション付きサンプルを使用して、目に見えないクラスをセグメントすることを目的としている。
いくつかのFSSメソッドは、サポートイメージの背景を使用して、クエリイメージの背景を特定することでこの問題に対処しようとする。
本稿では,クエリ画像自体から背景を抽出するQSRを提案する。
論文 参考訳(メタデータ) (2022-10-21T15:49:16Z) - Fusing Local Similarities for Retrieval-based 3D Orientation Estimation
of Unseen Objects [70.49392581592089]
我々は,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。
我々は検索ベースの戦略に従い、ネットワークがオブジェクト固有の特徴を学習するのを防ぐ。
また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-16T08:53:00Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - On the Unreasonable Effectiveness of Centroids in Image Retrieval [0.1933681537640272]
本稿では,トレーニングと検索の両方において,平均セントロイド表現を用いることを提案する。
各クラスは単一の埋め込み – クラスセントロイド – で表現されるため、検索時間とストレージ要件の両方が大幅に削減される。
論文 参考訳(メタデータ) (2021-04-28T08:57:57Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Noise or Signal: The Role of Image Backgrounds in Object Recognition [93.55720207356603]
我々は、ImageNetイメージ上の前景と背景信号をアンタングリングするためのツールキットを作成する。
a)モデルが背景のみに依存して非自明な精度が得られること、(b)モデルが正しく分類された前景が存在する場合でも、しばしば画像の分類を誤っていること、が分かる。
論文 参考訳(メタデータ) (2020-06-17T16:54:43Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。