論文の概要: Age Range Estimation using MTCNN and VGG-Face Model
- arxiv url: http://arxiv.org/abs/2104.08585v1
- Date: Sat, 17 Apr 2021 15:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-23 08:46:42.702780
- Title: Age Range Estimation using MTCNN and VGG-Face Model
- Title(参考訳): MTCNNとVGG面モデルを用いた年代推定
- Authors: Dipesh Gyawali, Prashanga Pokharel, Ashutosh Chauhan, Subodh Chandra
Shakya
- Abstract要約: CNNを用いた年齢範囲推定は無数の分野に応用されている。
CNNの深いモデルは、提案された作業における人々の年齢範囲の識別に使用されます。
- 参考スコア(独自算出の注目度): 0.11454121287632513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Convolutional Neural Network has amazed us with its usage on several
applications. Age range estimation using CNN is emerging due to its application
in myriad of areas which makes it a state-of-the-art area for research and
improve the estimation accuracy. A deep CNN model is used for identification of
people's age range in our proposed work. At first, we extracted only face
images from image dataset using MTCNN to remove unnecessary features other than
face from the image. Secondly, we used random crop technique for data
augmentation to improve the model performance. We have used the concept of
transfer learning in our research. A pretrained face recognition model i.e
VGG-Face is used to build our model for identification of age range whose
performance is evaluated on Adience Benchmark for confirming the efficacy of
our work. The performance in test set outperformed existing state-of-the-art by
substantial margins.
- Abstract(参考訳): Convolutional Neural Networkは、いくつかのアプリケーションで使われていることに驚いた。
CNNを用いた年齢範囲推定は、無数の領域に応用され、研究の最先端領域となり、推定精度の向上が図られている。
提案した研究の年齢範囲を同定するために, 深層CNNモデルを用いた。
まず,mtcnnを用いた画像データセットから顔画像のみを抽出し,画像から顔以外の不要な特徴を除去する。
第2に,データ拡張に乱作法を用いてモデル性能を向上した。
我々は,転帰学習の概念を研究に用いている。
Adience Benchmarkで評価した年齢帯識別モデルの構築に,事前学習した顔認識モデル,すなわちVGG-Faceを用いた。
テストのパフォーマンスは、既存の最先端をかなりのマージンで上回った。
関連論文リスト
- Modeling & Evaluating the Performance of Convolutional Neural Networks for Classifying Steel Surface Defects [0.0]
近年,畳み込みニューラルネットワーク(CNN)により画像分類タスクにおける顕著な識別率が達成されている。
DenseNet201は、NEUデータセットで最大の検出率を示し、98.37%に低下した。
論文 参考訳(メタデータ) (2024-06-19T08:14:50Z) - Age Estimation Based on Graph Convolutional Networks and Multi-head
Attention Mechanisms [0.0]
グラフ畳み込みネットワーク(GCN)は不規則な顔画像から特徴を効果的に抽出するために用いられる。
このモデルは、年齢推定の精度を効果的に向上させ、MAE誤差値を3.64に削減し、今日の年齢推定モデルよりも優れている。
論文 参考訳(メタデータ) (2023-10-12T06:26:39Z) - Identity-Preserving Aging of Face Images via Latent Diffusion Models [22.2699253042219]
顔画像の老化・老化に対する遅延テキスト・ツー・イメージ拡散モデルの提案, 評価, 評価を行った。
我々のモデルは、数発の訓練で成功し、直感的なテキストプロンプトによって制御できることのメリットが加わった。
論文 参考訳(メタデータ) (2023-07-17T15:57:52Z) - MiVOLO: Multi-input Transformer for Age and Gender Estimation [0.0]
最新の視覚変換器を用いた年齢・性別推定手法であるMiVOLOを提案する。
本手法は両タスクを統合された二重入力/出力モデルに統合する。
モデルの年齢認識性能を人間レベルの精度と比較し、ほとんどの年齢範囲で人間よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-10T14:58:10Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Multi-layer Representation Learning for Robust OOD Image Classification [3.1372269816123994]
我々は、CNNの中間層から特徴を抽出することで、モデルの最終的な予測を支援することができると主張している。
具体的には、ハイパーカラム法をResNet-18に適用し、NICOデータセットで評価した場合、モデルの精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-07-27T17:46:06Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - Facial Masks and Soft-Biometrics: Leveraging Face Recognition CNNs for
Age and Gender Prediction on Mobile Ocular Images [53.913598771836924]
スマートフォンで撮影した自撮り眼画像を使って年齢や性別を推定します。
ImageNet Challengeの文脈で提案された2つの既存の軽量CNNを適応させる。
一部のネットワークは顔認識のためにさらにトレーニングされており、非常に大規模なトレーニングデータベースが利用可能です。
論文 参考訳(メタデータ) (2021-03-31T01:48:29Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。