論文の概要: Orthonormal Product Quantization Network for Scalable Face Image
Retrieval
- arxiv url: http://arxiv.org/abs/2107.00327v4
- Date: Fri, 12 May 2023 11:56:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-15 16:49:27.908884
- Title: Orthonormal Product Quantization Network for Scalable Face Image
Retrieval
- Title(参考訳): スケーラブル顔画像検索のための正規化製品量子化ネットワーク
- Authors: Ming Zhang, Xuefei Zhe, Hong Yan
- Abstract要約: 本稿では、製品量化と正規の制約をエンドツーエンドのディープラーニングフレームワークに統合し、顔画像を取得する。
事前定義された正規直交ベクトルをコードワードとして用いる新しいスキームを提案し,量子化情報性を高め,符号ワードの冗長性を低減した。
4つの顔データセットに対して、目視と目視の両方のID検索設定で実験を行う。
- 参考スコア(独自算出の注目度): 14.583846619121427
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Existing deep quantization methods provided an efficient solution for
large-scale image retrieval. However, the significant intra-class variations
like pose, illumination, and expressions in face images, still pose a challenge
for face image retrieval. In light of this, face image retrieval requires
sufficiently powerful learning metrics, which are absent in current deep
quantization works. Moreover, to tackle the growing unseen identities in the
query stage, face image retrieval drives more demands regarding model
generalization and system scalability than general image retrieval tasks. This
paper integrates product quantization with orthonormal constraints into an
end-to-end deep learning framework to effectively retrieve face images.
Specifically, a novel scheme that uses predefined orthonormal vectors as
codewords is proposed to enhance the quantization informativeness and reduce
codewords' redundancy. A tailored loss function maximizes discriminability
among identities in each quantization subspace for both the quantized and
original features. An entropy-based regularization term is imposed to reduce
the quantization error. Experiments are conducted on four commonly-used face
datasets under both seen and unseen identities retrieval settings. Our method
outperforms all the compared deep hashing/quantization state-of-the-arts under
both settings. Results validate the effectiveness of the proposed orthonormal
codewords in improving models' standard retrieval performance and
generalization ability. Combing with further experiments on two general image
datasets, it demonstrates the broad superiority of our method for scalable
image retrieval.
- Abstract(参考訳): 既存の深部量子化手法は大規模画像検索の効率的な解法となった。
しかし、ポーズ、照明、表情などのクラス内の重要なバリエーションは、依然として顔画像の検索に挑戦している。
これを踏まえて、顔画像検索は、現在の深層量子化作業に欠けている十分な強力な学習指標を必要とする。
さらに,検索段階における未知のアイデンティティの増大に対処するために,顔画像検索は,一般的な画像検索タスクよりも,モデル一般化やシステムのスケーラビリティに対する要求が高まる。
本稿では,製品量子化と正規直交制約とをエンドツーエンドのディープラーニングフレームワークに統合し,効果的に顔画像を取り出す。
具体的には,事前定義された正規直交ベクトルを符号語として用いる新しいスキームを提案し,量子化情報性を高め,符号語の冗長性を低減する。
追尾損失関数は、量子化部分空間における各量子化部分空間の識別性を、量子化と元の両方の特徴に対して最大化する。
量子化誤差を低減するためにエントロピーベースの正則化項が課される。
4つの顔データセットに対して、目視と目視の両方で実験を行う。
提案手法は,両設定で比較した深部ハッシュ/量子化状態よりも優れる。
提案した正規正規コードワードの有効性は,モデルの標準検索性能と一般化能力の向上に有効である。
2つの一般的な画像データセットに関するさらなる実験を組み合わせることで,スケーラブルな画像検索手法の広範な優位性を実証する。
関連論文リスト
- Quantum-enhanced unsupervised image segmentation for medical images analysis [2.1485350418225244]
乳がんは、世界中で女性のがん関連死亡の原因となっている。
人工知能を用いたイメージセグメンテーションは、このワークフローを合理化するための有望な代替手段を提供する。
マンモグラフィーの医用画像セグメンテーションのための第1のエンドツーエンド量子拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-22T17:28:07Z) - Guided Deep Generative Model-based Spatial Regularization for Multiband
Imaging Inverse Problems [14.908906329456842]
本稿では,高空間分解能の補助的獲得に乗じて,データ駆動型空間正規化を導出するための汎用フレームワークを提案する。
より正確には、この空間解像度の補助画像に含まれる空間意味的特徴を符号化できる深層生成ネットワークとして、正規化が考え出される。
論文 参考訳(メタデータ) (2023-06-29T03:48:50Z) - Retrieval-based Spatially Adaptive Normalization for Semantic Image
Synthesis [68.1281982092765]
本稿では,Retrieval-based spatially AdaptIve normalization (RESAIL) と呼ばれる新しい正規化モジュールを提案する。
RESAILは、正規化アーキテクチャに対するピクセルレベルのきめ細かいガイダンスを提供する。
いくつかの挑戦的なデータセットの実験により、RESAILは定量的メトリクス、視覚的品質、主観的評価の観点から、最先端技術に対して好意的に機能することが示された。
論文 参考訳(メタデータ) (2022-04-06T14:21:39Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Image De-Quantization Using Generative Models as Priors [4.467248776406006]
De-quantizationは、量子化効果を反転させ、元のマルチクロマティックレベルのイメージを復元するタスクである。
我々は,古典的統計的推定理論に基づく厳密な数学的解析により,非量子化機構を開発する。
論文 参考訳(メタデータ) (2020-07-15T18:09:00Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Deep Attentive Generative Adversarial Network for Photo-Realistic Image
De-Quantization [25.805568996596783]
減量子化は、高ビット深度画面に表示するための低ビット深度画像の視覚的品質を改善することができる。
本稿では,画像強度分解能の超解像を実現するためのDAGANアルゴリズムを提案する。
DenseResAttモジュールは、自己保持機構を備えた密集した残留ブロックで構成されている。
論文 参考訳(メタデータ) (2020-04-07T06:45:01Z) - Generalized Product Quantization Network for Semi-supervised Image
Retrieval [16.500174965126238]
本稿では,GPQ(Generalized Product Quantization)ネットワークを用いた最初の量子化に基づく半教師付き画像検索手法を提案する。
ラベル付きデータのセマンティックな類似性を保ち、エントロピー正規化項を用いてラベル付きデータの固有ポテンシャルを完全に活用する新しい計量学習戦略を設計する。
我々のソリューションは量子化ネットワークの一般化能力を高め、検索コミュニティにおける以前の制限を克服することを可能にする。
論文 参考訳(メタデータ) (2020-02-26T03:36:32Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。