論文の概要: Pyramid Hybrid Pooling Quantization for Efficient Fine-Grained Image
Retrieval
- arxiv url: http://arxiv.org/abs/2109.05206v1
- Date: Sat, 11 Sep 2021 07:21:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-18 14:41:40.427419
- Title: Pyramid Hybrid Pooling Quantization for Efficient Fine-Grained Image
Retrieval
- Title(参考訳): 高精細画像検索のためのピラミッドハイブリッドポーリング量子化
- Authors: Ziyun Zeng, Jinpeng Wang, Bin Chen, Tao Dai, Shu-Tao Xia
- Abstract要約: ディープ量子化やディープバイナリハッシュといったディープハッシュアプローチは、大規模な画像検索の一般的な解決策となっている。
きめ細かい画像ハッシュを改善するために、ピラミッドハイブリッドポーリング量子化(PHPQ)を提案する。
- 参考スコア(独自算出の注目度): 41.23507715687314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep hashing approaches, including deep quantization and deep binary hashing,
have become a common solution to large-scale image retrieval due to high
computation and storage efficiency. Most existing hashing methods can not
produce satisfactory results for fine-grained retrieval, because they usually
adopt the outputs of the last CNN layer to generate binary codes, which is less
effective to capture subtle but discriminative visual details. To improve
fine-grained image hashing, we propose Pyramid Hybrid Pooling Quantization
(PHPQ). Specifically, we propose a Pyramid Hybrid Pooling (PHP) module to
capture and preserve fine-grained semantic information from multi-level
features. Besides, we propose a learnable quantization module with a partial
attention mechanism, which helps to optimize the most relevant codewords and
improves the quantization. Comprehensive experiments demonstrate that PHPQ
outperforms state-of-the-art methods.
- Abstract(参考訳): ディープ・量子化やディープ・バイナリ・ハッシュを含むディープ・ハッシュ・アプローチは、高い計算能力とストレージ効率のため、大規模な画像検索に対する一般的な解決策となっている。
ほとんどの既存のハッシュ法は、通常、バイナリコードを生成するために最後のCNN層の出力を採用するため、微妙だが識別的な視覚的詳細を捉えるのに効果が低いため、きめ細かな検索に満足できる結果が得られない。
微粒化画像ハッシュを改善するために, ピラミッドハイブリッドポーリング量子化(PHPQ)を提案する。
具体的には,多層機能から細粒度の意味情報を捕捉し,保存するピラミッドハイブリッドポーリング(PHP)モジュールを提案する。
さらに,最も関連するコードワードを最適化し,量子化を改善する部分的注意機構を備えた学習可能な量子化モジュールを提案する。
総合的な実験により、PHPQは最先端のメソッドよりも優れています。
関連論文リスト
- Weakly Supervised Deep Hyperspherical Quantization for Image Retrieval [76.4407063566172]
Weakly-Supervised Deep Hyperspherical Quantization (WSDHQ)を提案する。
具体的には,1)単語の埋め込みを用いてタグを表現し,タグ相関グラフに基づく意味情報を強化する。
我々は、よく設計された融合層とテーラーメイドの損失関数を用いて、セマンティックス保存の埋め込みと超球上の量子化器を協調的に学習する。
論文 参考訳(メタデータ) (2024-04-07T15:48:33Z) - Cascading Hierarchical Networks with Multi-task Balanced Loss for
Fine-grained hashing [1.6244541005112747]
きめ細かいハッシュは従来のハッシュ問題よりも難しい。
本稿では,コンパクトでセマンティックなハッシュコードを学習するためのカスケードネットワークを提案する。
また,マルチタスク学習の損失を協調的にバランスさせる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-20T17:08:48Z) - A Lower Bound of Hash Codes' Performance [122.88252443695492]
本稿では,ハッシュ符号間のクラス間の差分性とクラス内圧縮性が,ハッシュ符号の性能の低い境界を決定することを証明する。
次に、ハッシュコードの後部を推定し、それを制御することにより、上記の目的を完全に活用する代理モデルを提案し、低バイアス最適化を実現する。
一連のハッシュモデルをテストすることで、平均精度が最大で26.5%、精度が最大で20.5%向上した。
論文 参考訳(メタデータ) (2022-10-12T03:30:56Z) - TransHash: Transformer-based Hamming Hashing for Efficient Image
Retrieval [0.0]
textbfTranshashは、深層ハッシュ学習のための純粋なトランスフォーマーベースのフレームワークである。
3つの公開データセットのハッシュビット長の平均テキストサイズmAPでは,8.2%,2.6%,12.7%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2021-05-05T01:35:53Z) - Deep Reinforcement Learning with Label Embedding Reward for Supervised
Image Hashing [85.84690941656528]
深層型ハッシュのための新しい意思決定手法を提案する。
我々はBose-Chaudhuri-Hocquenghem符号で定義された新しいラベル埋め込み報酬を用いて、深いQ-ネットワークを学ぶ。
我々の手法は、様々なコード長で最先端の教師付きハッシュ法より優れています。
論文 参考訳(メタデータ) (2020-08-10T09:17:20Z) - Deep Hashing with Hash-Consistent Large Margin Proxy Embeddings [65.36757931982469]
画像ハッシュコードは、分類または検索のために訓練された畳み込みニューラルネットワーク(CNN)の埋め込みをバイナライズすることによって生成される。
この曖昧さを解消するために、固定されたプロキシ(CNN分類層の重み)の使用が提案されている。
得られたHCLMプロキシはハッシュ単位の飽和を促進することが示され、小さな二項化誤差が保証される。
論文 参考訳(メタデータ) (2020-07-27T23:47:43Z) - A survey on deep hashing for image retrieval [7.156209824590489]
本稿では,既存のハッシュ手法のボトルネックを突破しようとするシャドウリカレントハッシュ(SRH)手法を提案する。
具体的には、画像の意味的特徴を抽出するCNNアーキテクチャを考案し、類似した画像を近接に投影するロス関数を設計する。
データセットCIFAR-10のいくつかの実験は、SRHの満足な性能を示している。
論文 参考訳(メタデータ) (2020-06-10T03:01:59Z) - Dual-level Semantic Transfer Deep Hashing for Efficient Social Image
Retrieval [35.78137004253608]
ソーシャルネットワークは膨大な量のユーザ共有画像を保存し、配布する。
ディープハッシュは、大規模社会画像検索をサポートする効率的なインデックス化技術である。
既存の手法は、大量のディープニューラルネットワークパラメータを最適化する際に、深刻なセマンティックな不足に悩まされる。
本稿では,DSTDH(Dual-level Semantic Transfer Deep Hashing)法を提案する。
論文 参考訳(メタデータ) (2020-06-10T01:03:09Z) - Auto-Encoding Twin-Bottleneck Hashing [141.5378966676885]
本稿では,効率よく適応的なコード駆動グラフを提案する。
自動エンコーダのコンテキストでデコードすることで更新される。
ベンチマークデータセットの実験は、最先端のハッシュ手法よりもフレームワークの方が優れていることを明らかに示しています。
論文 参考訳(メタデータ) (2020-02-27T05:58:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。