論文の概要: Median Pixel Difference Convolutional Network for Robust Face
Recognition
- arxiv url: http://arxiv.org/abs/2205.15867v1
- Date: Mon, 30 May 2022 13:15:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-02 10:59:33.975914
- Title: Median Pixel Difference Convolutional Network for Robust Face
Recognition
- Title(参考訳): ロバスト顔認識のための中間画素差分畳み込みネットワーク
- Authors: Jiehua Zhang, Zhuo Su, Li Liu
- Abstract要約: 畳み込みニューラルネットワーク(CNN)に基づく既存の顔認識アルゴリズムは、ノイズに弱い。
ノイズ劣化した画像パターンは、偽のアクティベーションを引き起こし、ノイズのある状況下での顔認識精度を著しく低下させる。
本稿では,CNNに異なるレベルのノイズに頑健性を持たせるために,MeDiNet(Men Pixel Different Convolutional Network)を提案する。
- 参考スコア(独自算出の注目度): 8.636370632339785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face recognition is one of the most active tasks in computer vision and has
been widely used in the real world. With great advances made in convolutional
neural networks (CNN), lots of face recognition algorithms have achieved high
accuracy on various face datasets. However, existing face recognition
algorithms based on CNNs are vulnerable to noise. Noise corrupted image
patterns could lead to false activations, significantly decreasing face
recognition accuracy in noisy situations. To equip CNNs with built-in
robustness to noise of different levels, we proposed a Median Pixel Difference
Convolutional Network (MeDiNet) by replacing some traditional convolutional
layers with the proposed novel Median Pixel Difference Convolutional Layer
(MeDiConv) layer. The proposed MeDiNet integrates the idea of traditional
multiscale median filtering with deep CNNs. The MeDiNet is tested on the four
face datasets (LFW, CA-LFW, CP-LFW, and YTF) with versatile settings on blur
kernels, noise intensities, scales, and JPEG quality factors. Extensive
experiments show that our MeDiNet can effectively remove noisy pixels in the
feature map and suppress the negative impact of noise, leading to achieving
limited accuracy loss under these practical noises compared with the standard
CNN under clean conditions.
- Abstract(参考訳): 顔認識はコンピュータビジョンにおいて最も活発なタスクの1つであり、現実世界で広く使われている。
畳み込みニューラルネットワーク(cnn)では、多くの顔認識アルゴリズムが様々な顔データセットで高い精度を達成している。
しかし、既存のCNNに基づく顔認識アルゴリズムはノイズに弱い。
ノイズ劣化した画像パターンは、偽のアクティベーションを引き起こし、ノイズのある状況下での顔認識精度を著しく低下させる。
cnnに異なるレベルのノイズに頑健性を持たせるため,従来の畳み込み層を新たに提案する中央値画素差畳み込み層(mediconv)層に置き換え,中央値画素差畳み込みネットワーク(medinet)を提案した。
提案するMeDiNetは、従来のマルチスケール中央値フィルタリングを深層CNNと統合する。
MeDiNetは4つの顔データセット(LFW、CA-LFW、CP-LFW、YTF)でテストされており、ボケカーネル、ノイズインテンシティ、スケール、JPEG品質要素を多用している。
広範な実験により,我々のメディネットは,特徴マップ内のノイズ画素を効果的に除去し,ノイズの負の影響を抑制することができ,クリーンな条件下での標準cnnと比較して,実用的な雑音下での精度の低下が抑制されることが示された。
関連論文リスト
- A cross Transformer for image denoising [83.68175077524111]
直列ブロック(SB)、並列ブロック(PB)、残留ブロック(RB)を備えたクロストランスフォーマー(CTNet)を提案する。
CTNetは、実画像や合成画像のデノナイジングにおいて、一般的なデノナイジング法よりも優れている。
論文 参考訳(メタデータ) (2023-10-16T13:53:19Z) - SqueezerFaceNet: Reducing a Small Face Recognition CNN Even More Via
Filter Pruning [55.84746218227712]
我々は,100万パラメータ未満の軽量顔認識ネットワークであるSqueezerFaceNetを開発した。
性能を損なうことなく、さらに(最大40%)削減できることを示す。
論文 参考訳(メタデータ) (2023-07-20T08:38:50Z) - Spatially Adaptive Self-Supervised Learning for Real-World Image
Denoising [73.71324390085714]
本稿では,現実の sRGB 画像復号化の問題を解決するために,新しい視点を提案する。
ノイズの多い画像における平坦領域とテクスチャ領域のそれぞれの特徴を考慮し、それらを個別に管理する。
LAN自体がBNNの出力で管理されているのに対して,我々はその要件を満たすためのローカル・アウェア・ネットワーク(LAN)を提案する。
論文 参考訳(メタデータ) (2023-03-27T06:18:20Z) - A deep convolutional neural network for salt-and-pepper noise removal
using selective convolutional blocks [0.0]
グレースケールおよびカラー画像におけるSAPノイズを抑制するための深層CNNモデルSeConvNetを提案する。
SeConvNetは、様々な共通のデータセットに関する広範な実験を用いて、最先端のSAP復調手法と比較される。
論文 参考訳(メタデータ) (2023-02-10T18:51:19Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - WaveCNet: Wavelet Integrated CNNs to Suppress Aliasing Effect for
Noise-Robust Image Classification [41.94702591058716]
畳み込みニューラルネットワーク(CNN)はノイズを遮断する傾向がある。
我々は、共通のダウンサンプリングを離散ウェーブレット変換(DWT)に置き換えることで、CNNとウェーブレットを統合することを試みる。
我々はまた、ImageNet、ImageNet-C、および6つの敵攻撃のノイズバージョンでWaveCNetsの性能を検証した。
論文 参考訳(メタデータ) (2021-07-28T12:59:15Z) - Efficient Deep Image Denoising via Class Specific Convolution [24.103826414190216]
画素ワイズ分類に基づく画像復調のための効率的なディープニューラルネットワークを提案する。
提案手法は性能を犠牲にすることなく計算コストを削減できる。
論文 参考訳(メタデータ) (2021-03-02T10:28:15Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Deep Universal Blind Image Denoising [26.77629755630694]
深層畳み込みニューラルネットワーク(cnns)は、大規模な合成データセットを組み込むことで、画像のノイズ化に大きな成功を収めている。
ベイズ的視点に基づく両手法の利点を生かしたCNNに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-01-18T11:49:21Z) - Homography Estimation with Convolutional Neural Networks Under
Conditions of Variance [0.0]
畳み込みニューラルネットワーク(CNN)を用いた最近の2つの手法の性能解析を行った。
CNNは、ノイズに対してより堅牢であるように訓練できるが、ノイズのないケースでは精度が低い。
我々は,CNNを特定の音の大きさに訓練すると,CNNが最高の性能を示す騒音レベルに対して,Goldilocks Zoneが生じることを示す。
論文 参考訳(メタデータ) (2020-10-02T15:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。