論文の概要: Feature Super-Resolution Based Facial Expression Recognition for
Multi-scale Low-Resolution Faces
- arxiv url: http://arxiv.org/abs/2004.02234v1
- Date: Sun, 5 Apr 2020 15:38:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 13:12:46.194088
- Title: Feature Super-Resolution Based Facial Expression Recognition for
Multi-scale Low-Resolution Faces
- Title(参考訳): 特徴超解像に基づく多次元低解像顔の表情認識
- Authors: Wei Jing, Feng Tian, Jizhong Zhang, Kuo-Ming Chao, Zhenxin Hong, Xu
Liu
- Abstract要約: 超解像法はしばしば低分解能画像の高精細化に使用されるが、FERタスクの性能は極低分解能画像では制限される。
本研究では,物体検出のための特徴的超解像法に触発されて,頑健な表情認識のための新たな生成逆ネットワークに基づく超解像法を提案する。
- 参考スコア(独自算出の注目度): 7.634398926381845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial Expressions Recognition(FER) on low-resolution images is necessary for
applications like group expression recognition in crowd scenarios(station,
classroom etc.). Classifying a small size facial image into the right
expression category is still a challenging task. The main cause of this problem
is the loss of discriminative feature due to reduced resolution.
Super-resolution method is often used to enhance low-resolution images, but the
performance on FER task is limited when on images of very low resolution. In
this work, inspired by feature super-resolution methods for object detection,
we proposed a novel generative adversary network-based feature level
super-resolution method for robust facial expression recognition(FSR-FER). In
particular, a pre-trained FER model was employed as feature extractor, and a
generator network G and a discriminator network D are trained with features
extracted from images of low resolution and original high resolution. Generator
network G tries to transform features of low-resolution images to more
discriminative ones by making them closer to the ones of corresponding
high-resolution images. For better classification performance, we also proposed
an effective classification-aware loss re-weighting strategy based on the
classification probability calculated by a fixed FER model to make our model
focus more on samples that are easily misclassified. Experiment results on
Real-World Affective Faces (RAF) Database demonstrate that our method achieves
satisfying results on various down-sample factors with a single model and has
better performance on low-resolution images compared with methods using image
super-resolution and expression recognition separately.
- Abstract(参考訳): 低解像度画像上での表情認識(fer)は,群衆シナリオ(駅,教室など)におけるグループ表現認識などの応用には不可欠である。
小さめの顔画像を正しい表現カテゴリーに分類することは依然として難しい課題である。
この問題の主な原因は、解像度の低下による識別的特徴の喪失である。
超解像法はしばしば低解像度画像を強化するために用いられるが、非常に低解像度の画像ではferタスクの性能が制限される。
本研究では,オブジェクト検出のための特徴超解像法に触発されて,頑健な表情認識(FSR-FER)のための新たな生成逆ネットワークに基づく特徴レベル超解像法を提案する。
特に、予め訓練されたFERモデルを特徴抽出器として使用し、低解像度および原高解像度の画像から抽出された特徴により、ジェネレータネットワークGと判別器ネットワークDを訓練する。
ジェネレータネットワークgは、解像度の低い画像の特徴を、対応する高解像度画像に近づけることで、より識別的な画像に変換しようとする。
分類性能を向上するために,固定FERモデルにより算出された分類確率に基づいて,分類を誤分類し易くするための効果的な分類認識損失再重み付け手法を提案する。
real-world affective faces (raf) データベースを用いた実験により,単一のモデルで様々なダウンサンプル因子を満足させ,画像の超解像と表現認識を別々に用いた手法と比較して,低解像度画像での性能が向上することを示した。
関連論文リスト
- MrSARP: A Hierarchical Deep Generative Prior for SAR Image
Super-resolution [0.5161531917413706]
SAR画像のための新しい階層的深部生成モデルMrSARPを提案する。
MrSARPは、異なる解像度でターゲットの現実的なイメージであるかどうかを判断するために、複数の解像度の画像を共同でスコアする批評家と共同で訓練されている。
我々は,この深部生成モデルを用いて,同じターゲットの低解像度画像から高解像度画像を取得する方法を示す。
論文 参考訳(メタデータ) (2022-11-30T19:12:21Z) - Semantic Encoder Guided Generative Adversarial Face Ultra-Resolution
Network [15.102899995465041]
本稿では,セマンティックガイド付き生成逆顔超解像ネットワーク(SEGA-FURN)を提案する。
提案するネットワークは, 組込みセマンティクスを捕捉し, 対数学習を誘導する新しいセマンティクスエンコーダと, Residual in Internal Block (RIDB) という階層型アーキテクチャを用いた新しいジェネレータから構成される。
大規模顔データを用いた実験により,提案手法は優れた超解像結果が得られ,定性比較と定量的比較の両面で他の最先端手法よりも優れることが示された。
論文 参考訳(メタデータ) (2022-11-18T23:16:57Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Efficient texture-aware multi-GAN for image inpainting [5.33024001730262]
近年のGAN (Generative Adversarial Network) のインペイント手法は顕著に改善されている。
本稿では,性能とレンダリング効率の両方を改善するマルチGANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-30T14:58:03Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Joint Face Completion and Super-resolution using Multi-scale Feature
Relation Learning [26.682678558621625]
本稿では,MFG-GAN(MFG-GAN)を用いたマルチスケール機能グラフ生成手法を提案する。
GANに基づいて、MFG-GANはグラフ畳み込みとピラミッドネットワークを統合し、隠蔽された低解像度の顔画像を非隠蔽の高解像度の顔画像に復元する。
パブリックドメインCelebAとHelenデータベースの実験結果から,提案手法は顔超解像(最大4倍または8倍)と顔補完を同時に行う上で,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T13:31:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。