論文の概要: Facial Age Estimation using Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2105.06746v1
- Date: Fri, 14 May 2021 10:09:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 18:41:45.658587
- Title: Facial Age Estimation using Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いた顔年齢推定
- Authors: Adrian Kj{\ae}rran and Christian Bakke Venner{\o}d and Erling Stray
Bugge
- Abstract要約: 本論文は,ノルウェー科学技術大学における機械学習の学生プロジェクトの一部である。
5つの畳み込み層と3つの完全連結層を持つ深い畳み込みニューラルネットワークを提示し、画像に基づく個人の年齢を推定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper is a part of a student project in Machine Learning at the
Norwegian University of Science and Technology. In this paper, a deep
convolutional neural network with five convolutional layers and three
fully-connected layers is presented to estimate the ages of individuals based
on images. The model is in its entirety trained from scratch, where a
combination of three different datasets is used as training data. These
datasets are the APPA dataset, UTK dataset, and the IMDB dataset. The images
were preprocessed using a proprietary face-recognition software. Our model is
evaluated on both a held-out test set, and on the Adience benchmark. On the
test set, our model achieves a categorical accuracy of 52%. On the Adience
benchmark, our model proves inferior compared with other leading models, with
an exact accuray of 30%, and an one-off accuracy of 46%. Furthermore, a script
was created, allowing users to estimate their age directly using their web
camera. The script, alongside all other code, is located in our GitHub
repository: AgeNet.
- Abstract(参考訳): 本論文は,ノルウェー科学技術大学における機械学習の学生プロジェクトの一部である。
本稿では,5つの畳み込み層と3つの完全連結層を有する深層畳み込みニューラルネットワークを用いて,画像に基づいて個体の年齢を推定する。
モデルはスクラッチからトレーニングされ、3つの異なるデータセットの組み合わせがトレーニングデータとして使用される。
これらのデータセットはAPPAデータセット、UTKデータセット、IMDBデータセットである。
画像はプロプライエタリな顔認識ソフトウェアを使って前処理された。
我々のモデルはホールドアウトテストセットとAdienceベンチマークの両方で評価される。
テストセットにおいて,本モデルは52%のカテゴリ精度を達成している。
adienceベンチマークでは,本モデルが他の先行モデルに比べ,30%の精度と46%の精度で劣っていることを証明した。
さらにスクリプトが作成され、ユーザーはウェブカメラを使って年齢を直接見積もることができる。
スクリプトは、他のすべてのコードとともに、GitHubリポジトリ、 AgeNetにあります。
関連論文リスト
- LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文 参考訳(メタデータ) (2024-10-14T17:51:23Z) - Benchmark Analysis of Various Pre-trained Deep Learning Models on ASSIRA
Cats and Dogs Dataset [0.0]
ASSIRA Cats & Dogsデータセットは、全体的な受け入れとベンチマーク標準のためにこの研究で使用されている。
各種ベンチマークと損失関数を用いて,事前学習モデルの比較を行った。
この実験から、NASNet Largeを用いて99.65%の最高精度が得られる。
論文 参考訳(メタデータ) (2024-01-09T16:48:11Z) - Uncertainty in AI: Evaluating Deep Neural Networks on
Out-of-Distribution Images [0.0]
本稿では、摂動データを扱う際に、ResNet-50、VGG16、DenseNet121、AlexNet、GoogleNetなど様々なディープニューラルネットワークの不確実性について検討する。
ResNet-50はOODイメージの最も正確なシングルモデルであったが、アンサンブルはより良く、すべてのイメージを正しく分類した。
論文 参考訳(メタデータ) (2023-09-04T22:46:59Z) - Effective Robustness against Natural Distribution Shifts for Models with
Different Training Data [113.21868839569]
効果的ロバスト性」は、分配内(ID)性能から予測できる以上の余分な分配外ロバスト性を測定する。
異なるデータに基づいてトレーニングされたモデルの有効ロバスト性を評価・比較するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-02-02T19:28:41Z) - MATE: Masked Autoencoders are Online 3D Test-Time Learners [63.3907730920114]
MATEは3Dデータ用に設計された最初のTTT(Test-Time-Training)手法である。
テストデータで発生する分散シフトに対して、ポイントクラウド分類のためにトレーニングされたディープネットワークを堅牢にする。
論文 参考訳(メタデータ) (2022-11-21T13:19:08Z) - Portuguese Man-of-War Image Classification with Convolutional Neural
Networks [58.720142291102135]
ポルトガルマン・オブ・ウォー(ポルトガル語: Man-of-war、PMW)は、長い触手を持つゼラチン質の生物である。
本稿では,InstagramのソーシャルメディアからPMW画像を認識するための畳み込みニューラルネットワークの利用について報告する。
論文 参考訳(メタデータ) (2022-07-04T03:06:45Z) - Assessing Dataset Bias in Computer Vision [0.0]
偏見は、訓練するモデルに伝播する傾向があり、しばしば少数派ではパフォーマンスが劣る。
UTKFaceデータセットのサンプルに、アンダーサンプリング、幾何変換、可変オートエンコーダ(VAE)、生成逆ネットワーク(GAN)など、いくつかの拡張手法を適用する。
FairFaceモデルと比較して、複数のデータセット上の年齢と民族の分類において、我々のモデルが全体的なパフォーマンスと一貫性を向上できることを示しました。
論文 参考訳(メタデータ) (2022-05-03T22:45:49Z) - What Stops Learning-based 3D Registration from Working in the Real
World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。
最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。
我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文 参考訳(メタデータ) (2021-11-19T19:24:27Z) - EEGEyeNet: a Simultaneous Electroencephalography and Eye-tracking
Dataset and Benchmark for Eye Movement Prediction [5.10183147987411]
脳活動と眼球運動の交差に関する研究を進めることを目的とした新しいデータセットを提案する。
EEGEyeNetは、356人の被験者から同時脳波(EEG)と眼球追跡(ET)を同時に記録する。
また,脳波計測から視線予測を評価するためのベンチマークも提案する。
論文 参考訳(メタデータ) (2021-11-06T15:41:27Z) - Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control [0.0]
本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。
提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
論文 参考訳(メタデータ) (2020-11-23T07:55:24Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。