論文の概要: Class-Specific Variational Auto-Encoder for Content-Based Image
Retrieval
- arxiv url: http://arxiv.org/abs/2304.11734v1
- Date: Sun, 23 Apr 2023 19:51:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 16:47:42.973949
- Title: Class-Specific Variational Auto-Encoder for Content-Based Image
Retrieval
- Title(参考訳): コンテンツベース画像検索のためのクラス別変分オートエンコーダ
- Authors: Mehdi Rafiei and Alexandros Iosifidis
- Abstract要約: 本稿では,変分自動エンコーダ(VAE)に対する正規化損失を提案する。
その結果、モデルは、関心のクラスに属するデータを他のあらゆる可能性から識別することを学ぶ。
実験の結果,提案手法はドメイン内およびドメイン外検索における競合よりも優れていた。
- 参考スコア(独自算出の注目度): 95.42181254494287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Using a discriminative representation obtained by supervised deep learning
methods showed promising results on diverse Content-Based Image Retrieval
(CBIR) problems. However, existing methods exploiting labels during training
try to discriminate all available classes, which is not ideal in cases where
the retrieval problem focuses on a class of interest. In this paper, we propose
a regularized loss for Variational Auto-Encoders (VAEs) forcing the model to
focus on a given class of interest. As a result, the model learns to
discriminate the data belonging to the class of interest from any other
possibility, making the learnt latent space of the VAE suitable for
class-specific retrieval tasks. The proposed Class-Specific Variational
Auto-Encoder (CS-VAE) is evaluated on three public and one custom datasets, and
its performance is compared with that of three related VAE-based methods.
Experimental results show that the proposed method outperforms its competition
in both in-domain and out-of-domain retrieval problems.
- Abstract(参考訳): 教師付き深層学習法により得られた識別表現を用いて,多様なコンテンツベース画像検索(CBIR)問題に対して有望な結果を示した。
しかし、学習中にラベルを利用する既存の手法は、検索問題が関心のクラスに焦点をあてる場合に理想的ではないすべての利用可能なクラスを識別しようとする。
本稿では,変分自動エンコーダ(VAE)に対する正規化損失を提案する。
その結果、モデルが興味のあるクラスに属するデータを他の可能性から判別することを学習し、vaeの学習可能な潜在空間をクラス固有の検索タスクに適したものにする。
提案するクラス固有変分オートエンコーダ(cs-vae)を3つの公開データセットと1つのカスタムデータセットで評価し,その性能を関連する3つのvaeベース手法と比較した。
実験の結果,提案手法はドメイン内およびドメイン外検索における競合よりも優れていた。
関連論文リスト
- Accurate Explanation Model for Image Classifiers using Class Association Embedding [5.378105759529487]
本稿では,グローバルな知識とローカルな知識の利点を組み合わせた生成的説明モデルを提案する。
クラスアソシエーション埋め込み(CAE)は、各サンプルを1組のクラス関連コードと個別コードにエンコードする。
クラス関連特徴を個々の特徴から効率的に分離するビルディングブロック・コヒーレンシー特徴抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:41:00Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Open World Classification with Adaptive Negative Samples [89.2422451410507]
オープンワールド分類は、自然言語処理における重要な実践的妥当性と影響を伴う課題である。
そこで本研究では, アンダーライン適応型アンダーラインアンプ (ANS) に基づいて, 学習段階における効果的な合成オープンカテゴリサンプルを生成する手法を提案する。
ANSは最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-09T21:12:46Z) - R2-Trans:Fine-Grained Visual Categorization with Redundancy Reduction [21.11038841356125]
細粒度視覚分類(FGVC)は、クラス内の大きな多様性と微妙なクラス間差が主な課題である類似のサブカテゴリを識別することを目的としている。
本稿では,FGVCに対する新たなアプローチを提案する。FGVCは,環境条件における部分的かつ十分な識別情報を同時に利用でき,また,対象物に対するクラストークンにおける冗長情報を圧縮することができる。
論文 参考訳(メタデータ) (2022-04-21T13:35:38Z) - Universal Domain Adaptation in Ordinal Regression [11.703377306384695]
順序回帰(OR)における普遍領域適応(UDA)の問題に対処する。
本稿では, クラスタリングの仮定に基づいて, OR設定のアンダーパフォーマンスに基づいて, 分類のために開発されたUDA技術について述べる。
本稿では,OR分類器と注文学習の補助的タスクを補完する手法を提案する。これは,共通インスタンスとプライベートインスタンスの識別と,ランキングによるクラスラベルのプライベートターゲットイメージへの拡張という二重の役割を担っている。
論文 参考訳(メタデータ) (2021-06-22T07:23:39Z) - Zero-sample surface defect detection and classification based on
semantic feedback neural network [13.796631421521765]
本論文では,複数角度からの画像タグ埋め込みにおける予測誤差を適応的に低減するアンサンブル協調学習アルゴリズムを提案する。
産業分野におけるゼロショットデータセットとシリンダーライナーデータセットを用いた各種実験により,競争結果が得られた。
論文 参考訳(メタデータ) (2021-06-15T08:26:36Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。