論文の概要: Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval
- arxiv url: http://arxiv.org/abs/2404.04998v1
- Date: Sun, 7 Apr 2024 15:48:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 16:22:29.664933
- Title: Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval
- Title(参考訳): 深部超球面量子化による画像検索
- Authors: Jinpeng Wang, Bin Chen, Qiang Zhang, Zaiqiao Meng, Shangsong Liang, Shu-Tao Xia,
- Abstract要約: Weakly-Supervised Deep Hyperspherical Quantization (WSDHQ)を提案する。
具体的には,1)単語の埋め込みを用いてタグを表現し,タグ相関グラフに基づく意味情報を強化する。
我々は、よく設計された融合層とテーラーメイドの損失関数を用いて、セマンティックス保存の埋め込みと超球上の量子化器を協調的に学習する。
- 参考スコア(独自算出の注目度): 76.4407063566172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep quantization methods have shown high efficiency on large-scale image retrieval. However, current models heavily rely on ground-truth information, hindering the application of quantization in label-hungry scenarios. A more realistic demand is to learn from inexhaustible uploaded images that are associated with informal tags provided by amateur users. Though such sketchy tags do not obviously reveal the labels, they actually contain useful semantic information for supervising deep quantization. To this end, we propose Weakly-Supervised Deep Hyperspherical Quantization (WSDHQ), which is the first work to learn deep quantization from weakly tagged images. Specifically, 1) we use word embeddings to represent the tags and enhance their semantic information based on a tag correlation graph. 2) To better preserve semantic information in quantization codes and reduce quantization error, we jointly learn semantics-preserving embeddings and supervised quantizer on hypersphere by employing a well-designed fusion layer and tailor-made loss functions. Extensive experiments show that WSDHQ can achieve state-of-art performance on weakly-supervised compact coding. Code is available at https://github.com/gimpong/AAAI21-WSDHQ.
- Abstract(参考訳): ディープ量子化法は大規模画像検索において高い効率性を示している。
しかし、現在のモデルは地平線情報に大きく依存しており、ラベル・ハングリーのシナリオにおける量子化の適用を妨げる。
より現実的な要求は、アマチュアユーザーが提供した非公式なタグに関連付けられた、不明瞭なアップロードイメージから学ぶことである。
このようなスケッチ的なタグは明らかにラベルを明らかにしないが、実際には深い量子化を監督するのに有用な意味情報を含んでいる。
この目的のために,弱タグ付き画像から深部量子化を学ぶ最初の研究であるWakly-Supervised Deep Hyperspherical Quantization (WSDHQ)を提案する。
具体的には
1) 単語埋め込みを用いてタグを表現し, タグ相関グラフに基づく意味情報を強化する。
2) 量子化符号のセマンティック情報をよりよく保存し, 量子化誤差を低減するために, よく設計された融合層とテーラーメードの損失関数を用いて, 超球面上のセマンティックス保存と教師付き量子化器を共同で学習する。
大規模な実験により、WSDHQは弱教師付きコンパクトコーディングにおける最先端の性能を達成できることが示された。
コードはhttps://github.com/gimpong/AAAI21-WSDHQで公開されている。
関連論文リスト
- PEPL: Precision-Enhanced Pseudo-Labeling for Fine-Grained Image Classification in Semi-Supervised Learning [3.801446153948012]
半教師付き学習フレームワーク内でのきめ細かい画像分類のためのPEPL(Precision-Enhanced Pseudo-Labeling)手法を提案する。
提案手法は,高品質な擬似ラベルを生成することにより,ラベルなしデータの豊富さを活用する。
ベンチマークデータセット上での最先端のパフォーマンスを実現し、既存の半教師付き戦略よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-09-05T02:32:07Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Unpaired Image Captioning by Image-level Weakly-Supervised Visual
Concept Recognition [83.93422034664184]
未ペア画像キャプション(UIC)とは、訓練段階で画像キャプチャペアを使わずに画像を記述することである。
既存の研究の多くは、既成のアルゴリズムを使って視覚的概念を得る。
画像レベルラベルを用いたコスト効率の高いUICを実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T08:02:23Z) - Self-supervised Product Quantization for Deep Unsupervised Image
Retrieval [21.99902461562925]
改良されたディープラーニングベースのハッシュとベクトル量子化は、高速で大規模な画像検索システムを実現する。
本稿では,SPQ (Self-supervised Product Quantization) ネットワークと呼ばれる,ラベルフリーで,自己教師型で訓練された画像検索手法を提案する。
提案手法は,画像内容を分析して記述的特徴を抽出し,正確な検索のための画像表現の理解を可能にする。
論文 参考訳(メタデータ) (2021-09-06T05:02:34Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Leveraging Self-Supervision for Cross-Domain Crowd Counting [71.75102529797549]
混雑したシーンで人をカウントするための最先端の方法は、群衆密度を推定するために深いネットワークに依存します。
われわれのネットワークは、通常の画像から逆さまの実際の画像を認識できるように訓練し、その不確実性を予測する能力を組み込む。
このアルゴリズムは、推論時に余分な計算をせずに、最先端のクロスドメイン群をカウントするアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2021-03-30T12:37:55Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Dual-level Semantic Transfer Deep Hashing for Efficient Social Image
Retrieval [35.78137004253608]
ソーシャルネットワークは膨大な量のユーザ共有画像を保存し、配布する。
ディープハッシュは、大規模社会画像検索をサポートする効率的なインデックス化技術である。
既存の手法は、大量のディープニューラルネットワークパラメータを最適化する際に、深刻なセマンティックな不足に悩まされる。
本稿では,DSTDH(Dual-level Semantic Transfer Deep Hashing)法を提案する。
論文 参考訳(メタデータ) (2020-06-10T01:03:09Z) - Generalized Product Quantization Network for Semi-supervised Image
Retrieval [16.500174965126238]
本稿では,GPQ(Generalized Product Quantization)ネットワークを用いた最初の量子化に基づく半教師付き画像検索手法を提案する。
ラベル付きデータのセマンティックな類似性を保ち、エントロピー正規化項を用いてラベル付きデータの固有ポテンシャルを完全に活用する新しい計量学習戦略を設計する。
我々のソリューションは量子化ネットワークの一般化能力を高め、検索コミュニティにおける以前の制限を克服することを可能にする。
論文 参考訳(メタデータ) (2020-02-26T03:36:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。