論文の概要: Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control
- arxiv url: http://arxiv.org/abs/2011.11257v1
- Date: Mon, 23 Nov 2020 07:55:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 01:36:37.844816
- Title: Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control
- Title(参考訳): 畳み込みニューラルネットワークを用いた顔認識の入力アクセス制御への応用
- Authors: Lars Lien Ankile, Morgan Feet Heggland, Kjartan Krange
- Abstract要約: 本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。
提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The purpose of this paper is to design a solution to the problem of facial
recognition by use of convolutional neural networks, with the intention of
applying the solution in a camera-based home-entry access control system. More
specifically, the paper focuses on solving the supervised classification
problem of taking images of people as input and classifying the person in the
image as one of the authors or not. Two approaches are proposed: (1) building
and training a neural network called WoodNet from scratch and (2) leveraging
transfer learning by utilizing a network pre-trained on the ImageNet database
and adapting it to this project's data and classes. In order to train the
models to recognize the authors, a dataset containing more than 150 000 images
has been created, balanced over the authors and others. Image extraction from
videos and image augmentation techniques were instrumental for dataset
creation. The results are two models classifying the individuals in the dataset
with high accuracy, achieving over 99% accuracy on held-out test data. The
pre-trained model fitted significantly faster than WoodNet, and seems to
generalize better. However, these results come with a few caveats. Because of
the way the dataset was compiled, as well as the high accuracy, one has reason
to believe the models over-fitted to the data to some degree. An added
consequence of the data compilation method is that the test dataset may not be
sufficiently different from the training data, limiting its ability to validate
generalization of the models. However, utilizing the models in a web-cam based
system, classifying faces in real-time, shows promising results and indicates
that the models generalized fairly well for at least some of the classes (see
the accompanying video).
- Abstract(参考訳): 本研究の目的は,畳み込みニューラルネットワークによる顔認識問題に対する解決策を,カメラを用いたホームエントリーアクセス制御システムに適用することを目的として設計することである。
より具体的には、画像中の人物を入力として捉え、その人物を著者の1人か否かを分類する、教師付き分類問題の解決に焦点をあてる。
1) WoodNet と呼ばれるニューラルネットワークをスクラッチから構築,訓練し,(2) ImageNet データベース上で事前学習したネットワークを活用し,プロジェクトのデータやクラスに適応させることで伝達学習を活用する。
著者を認識するためにモデルをトレーニングするために、150万以上の画像を含むデータセットが作成され、著者らとバランスを取っている。
ビデオからの画像抽出と画像拡張技術はデータセット作成に役立った。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
事前訓練されたモデルはウッドネットよりもかなり速く取り付けられ、より一般化したようである。
しかし、これらの結果はいくつか注意点がある。
データセットのコンパイル方法や高精度のため、モデルがある程度データに過度に適合していると考える理由がある。
データコンパイルの方法が加わった結果、テストデータセットはトレーニングデータと十分な違いがなく、モデルの一般化を検証する能力が制限される可能性がある。
しかし,web-camベースのシステムでは,リアルタイムに顔の分類を行い,有望な結果を示し,少なくとも一部のクラスでは,モデルがかなりよく一般化されていることを示す(ビデオ参照)。
関連論文リスト
- Self-Supervised Learning in Deep Networks: A Pathway to Robust Few-Shot Classification [0.0]
まず、ラベルのない大量のデータから共通特徴表現を学習できるように、自己スーパービジョンでモデルを事前訓練する。
その後、数ショットのデータセットMini-ImageNetで微調整を行い、限られたデータの下でモデルの精度と一般化能力を改善する。
論文 参考訳(メタデータ) (2024-11-19T01:01:56Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - GOODAT: Towards Test-time Graph Out-of-Distribution Detection [103.40396427724667]
グラフニューラルネットワーク(GNN)は、さまざまな領域にわたるグラフデータのモデリングに広く応用されている。
近年の研究では、特定のモデルのトレーニングや、よく訓練されたGNN上でのデータ修正に重点を置いて、OOD検出のグラフを調査している。
本稿では、GNNアーキテクチャのトレーニングデータと修正から独立して動作する、データ中心、教師なし、プラグアンドプレイのソリューションを提案する。
論文 参考訳(メタデータ) (2024-01-10T08:37:39Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - A Novel Hand Gesture Detection and Recognition system based on
ensemble-based Convolutional Neural Network [3.5665681694253903]
コンピュータビジョンとパターン認識コミュニティでは,手の部分検出が課題となっている。
畳み込みニューラルネットワーク(CNN)アーキテクチャのようなディープラーニングアルゴリズムは、分類タスクにおいて非常に一般的な選択肢となっている。
本稿では,CNNに基づくアプローチのアンサンブルを用いて,予測時の高分散や過度な問題,予測誤差などの問題を克服する。
論文 参考訳(メタデータ) (2022-02-25T06:46:58Z) - Automated Cleanup of the ImageNet Dataset by Model Consensus,
Explainability and Confident Learning [0.0]
ImageNetは、ILSVRC12Netでトレーニングされた様々な畳み込みニューラルネットワーク(CNN)のバックボーンである。
本稿では,モデルのコンセンサス,説明可能性,自信のある学習に基づく自動アプリケーションについて述べる。
ImageNet-CleanはSqueezeNetおよびEfficientNet-B0モデルのモデルパフォーマンスを2-2.4%向上させる。
論文 参考訳(メタデータ) (2021-03-30T13:16:35Z) - Retrieval Augmentation to Improve Robustness and Interpretability of
Deep Neural Networks [3.0410237490041805]
本研究では,深層ニューラルネットワークの堅牢性と解釈性を改善するために,トレーニングデータを積極的に活用する。
具体的には、LSTMモデルのメモリ状態を初期化したり、注意機構を誘導するために、最も近い入力例のターゲットを用いる。
その結果,Flickr8 と IMDB の2つのタスクに対して提案したモデルの有効性が示された。
論文 参考訳(メタデータ) (2021-02-25T17:38:31Z) - An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation [80.02124918255059]
半教師付き学習は、ラベルなし画像の探索によってモデルの精度を高めることを目的としている。
私たちは相互に教え合うために2つのネットワークを学びます。
各ネットワーク内の容易なイメージに関するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
論文 参考訳(メタデータ) (2020-11-25T03:29:52Z) - Shape-Texture Debiased Neural Network Training [50.6178024087048]
畳み込みニューラルネットワークは、トレーニングデータセットによって、テクスチャまたは形状にバイアスされることが多い。
形状・テクスチャ・デバイアスド学習のためのアルゴリズムを開発した。
実験により,本手法は複数の画像認識ベンチマークにおけるモデル性能の向上に成功していることが示された。
論文 参考訳(メタデータ) (2020-10-12T19:16:12Z) - Multi-task pre-training of deep neural networks for digital pathology [8.74883469030132]
私たちはまず、多くのデジタル病理データセットを22の分類タスクと約900kの画像のプールに組み立て、変換しました。
特徴抽出器として使用されるモデルは、ImageNet事前訓練されたモデルよりも大幅に改善されるか、同等のパフォーマンスを提供するかを示す。
論文 参考訳(メタデータ) (2020-05-05T08:50:17Z) - Neural Networks Are More Productive Teachers Than Human Raters: Active
Mixup for Data-Efficient Knowledge Distillation from a Blackbox Model [57.41841346459995]
我々は,ブラックボックス教師モデルから知識を抽出し,学生の深層ニューラルネットワークを視覚認識のために訓練する方法を,データ効率のよい方法で研究する。
混合学習とアクティブラーニングを融合した手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T05:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。