論文の概要: Centre Symmetric Quadruple Pattern: A Novel Descriptor for Facial Image
Recognition and Retrieval
- arxiv url: http://arxiv.org/abs/2201.00511v1
- Date: Mon, 3 Jan 2022 07:56:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 15:19:56.946756
- Title: Centre Symmetric Quadruple Pattern: A Novel Descriptor for Facial Image
Recognition and Retrieval
- Title(参考訳): centre symmetric quadruple pattern: 顔画像認識と検索のための新しい記述子
- Authors: Soumendu Chakraborty, Satish Kumar Singh, and Pavan Chakraborty
- Abstract要約: 手作りのディスクリプタは、カーネルによって定義された局所的な近傍のピクセルの関係を識別する。
本稿では,四重空間における顔の非対称性を符号化する手書き記述子であるCentral Symmetric Quadruple Pattern (CSQP)を提案する。
結果分析の結果,提案する記述子は,ポーズ,照明,背景,表現の制御不能な変化とともに,制御下において良好に動作していることがわかった。
- 参考スコア(独自算出の注目度): 20.77994516381
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Facial features are defined as the local relationships that exist amongst the
pixels of a facial image. Hand-crafted descriptors identify the relationships
of the pixels in the local neighbourhood defined by the kernel. Kernel is a two
dimensional matrix which is moved across the facial image. Distinctive
information captured by the kernel with limited number of pixel achieves
satisfactory recognition and retrieval accuracies on facial images taken under
constrained environment (controlled variations in light, pose, expressions, and
background). To achieve similar accuracies under unconstrained environment
local neighbourhood has to be increased, in order to encode more pixels.
Increasing local neighbourhood also increases the feature length of the
descriptor. In this paper we propose a hand-crafted descriptor namely Centre
Symmetric Quadruple Pattern (CSQP), which is structurally symmetric and encodes
the facial asymmetry in quadruple space. The proposed descriptor efficiently
encodes larger neighbourhood with optimal number of binary bits. It has been
shown using average entropy, computed over feature images encoded with the
proposed descriptor, that the CSQP captures more meaningful information as
compared to state of the art descriptors. The retrieval and recognition
accuracies of the proposed descriptor has been compared with state of the art
hand-crafted descriptors (CSLBP, CSLTP, LDP, LBP, SLBP and LDGP) on bench mark
databases namely; LFW, Colour-FERET, and CASIA-face-v5. Result analysis shows
that the proposed descriptor performs well under controlled as well as
uncontrolled variations in pose, illumination, background and expressions.
- Abstract(参考訳): 顔の特徴は、顔画像のピクセル間に存在する局所的な関係として定義される。
手作りのディスクリプタは、カーネルによって定義されたローカル近傍のピクセル間の関係を識別する。
カーネル(kernel)は、顔画像を横切って動く二次元マトリックスである。
カーネルが限られたピクセル数でキャプチャした識別情報は、制約された環境下で撮影された顔画像(光、ポーズ、表情、背景の変化を制御)に対する良好な認識と検索精度を達成する。
より多くの画素を符号化するために、制約のない環境下で同様の精度を達成するために、近隣地域を増大させる必要がある。
地域住民の増加もディスクリプタの機能長を増加させる。
本稿では,四重項空間における顔非対称性を符号化し,構造的に対称な手作り記述子である中心対称四重項パターン(csqp)を提案する。
提案するディスクリプタは、より広い近傍を最適なバイナリビット数で効率的に符号化する。
提案するディスクリプタで符号化された特徴画像上で計算される平均エントロピーを用いて、csqpはアートディスクリプタの状態と比較してより意味のある情報をキャプチャすることを示した。
CSLBP, CSLTP, LDP, LBP, SLBP, LDGPのベンチマークデータベース(LFW, Colour-FERET, CASIA-face-v5)の検索と認識精度を比較検討した。
結果分析の結果,提案する記述子は,ポーズ,照明,背景,表現の制御不能な変化とともに,制御下において良好に動作していることがわかった。
関連論文リスト
- Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - PI-Trans: Parallel-ConvMLP and Implicit-Transformation Based GAN for
Cross-View Image Translation [84.97160975101718]
本稿では,新しい並列-ConvMLPモジュールと,複数のセマンティックレベルでのインプリシット変換モジュールで構成される,新しい生成逆ネットワークPI-Transを提案する。
PI-Transは、2つの挑戦的データセットの最先端手法と比較して、大きなマージンで最も質的で定量的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-07-09T10:35:44Z) - Semantic-shape Adaptive Feature Modulation for Semantic Image Synthesis [71.56830815617553]
きめ細かい部分レベルのセマンティックレイアウトは、オブジェクトの詳細生成に役立ちます。
各画素の位置特徴を記述するために,SPD (Shape-aware Position Descriptor) を提案する。
セマンティック形状適応特徴変調 (SAFM) ブロックは, 与えられた意味マップと位置特徴を組み合わせるために提案される。
論文 参考訳(メタデータ) (2022-03-31T09:06:04Z) - Semi-parametric Makeup Transfer via Semantic-aware Correspondence [99.02329132102098]
ソース非メイクアップ画像と参照メークアップ画像との間の大きな相違は、メイクアップ転送における重要な課題の1つである。
非パラメトリック技術は、ポーズ、表現、オクルージョンの相違に対処する高い可能性を持っている。
非パラメトリックおよびパラメトリック機構の相互強度を組み合わせたtextbfSemi-textbfparametric textbfMakeup textbfTransfer (SpMT) 法を提案する。
論文 参考訳(メタデータ) (2022-03-04T12:54:19Z) - Cascaded Asymmetric Local Pattern: A Novel Descriptor for Unconstrained
Facial Image Recognition and Retrieval [20.77994516381]
本稿では,顔画像の検索と認識のために,手作りの非対称局所パターン(CALP)を提案する。
提案手法は特徴長が最適であり,顔画像の環境および生理的変化下での精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2022-01-03T08:23:38Z) - Local Quadruple Pattern: A Novel Descriptor for Facial Image Recognition
and Retrieval [20.77994516381]
顔画像の認識と検索のために手作りの局所四重項パターン(LQPAT)を提案する。
提案された記述子は、四重空間における隣人間の関係を符号化する。
提案するデクリプタの検索と認識精度を,ベンチマークデータベース上の手作りデクリプタの状態と比較した。
論文 参考訳(メタデータ) (2022-01-03T08:04:38Z) - Local Gradient Hexa Pattern: A Descriptor for Face Recognition and
Retrieval [20.77994516381]
基準画素とその隣接する画素間の関係を同定する局所勾配ヘキサパターン(LGHP)を提案する。
識別情報は、地域や異なるデリバティブな方向でも存在している。
提案するディスクリプタは,最先端のディスクリプタに比べて高い認識率と検索率を有する。
論文 参考訳(メタデータ) (2022-01-03T07:45:36Z) - R-Theta Local Neighborhood Pattern for Unconstrained Facial Image
Recognition and Retrieval [20.77994516381]
R-Theta Local Neighborhood Pattern (RTLNP) は顔画像検索のために提案されている。
提案された符号化方式は、地域を等しい角幅のセクターに分割する。
これら2つのサブセクタの平均グレイスケール値は、マイクロパターンを生成するために符号化される。
論文 参考訳(メタデータ) (2022-01-03T07:39:23Z) - Enhancing Multi-Scale Implicit Learning in Image Super-Resolution with
Integrated Positional Encoding [4.781615891172263]
画像超解像コンテキストにおいて,各画素を局所領域からの信号の集約とみなす。
画素領域上の周波数情報を集約することで従来の位置符号化を拡張した位置符号化(IPE)を提案する。
IPE-LIIFの定量的および定性的評価による有効性を示し、さらに画像スケールへのIPEの一般化能力を示す。
論文 参考訳(メタデータ) (2021-12-10T06:09:55Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。