論文の概要: Training of SSD(Single Shot Detector) for Facial Detection using Nvidia
Jetson Nano
- arxiv url: http://arxiv.org/abs/2105.13906v1
- Date: Fri, 28 May 2021 15:16:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 15:18:16.043080
- Title: Training of SSD(Single Shot Detector) for Facial Detection using Nvidia
Jetson Nano
- Title(参考訳): Nvidia Jetson Nano を用いた顔検出用SSD(シングルショット検出器)の訓練
- Authors: Saif Ur Rehman, Muhammad Rashid Razzaq, Muhammad Hadi Hussian
- Abstract要約: 我々はコンピュータビジョンアルゴリズムSSD(Single Shot detector)コンピュータビジョンアルゴリズムを用いた。
画像はIntel CVAT (Computer Vision Tool) でラベル付けされた。
私たちはこのモデルを顔検出のために訓練した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this project, we have used the computer vision algorithm SSD (Single Shot
detector) computer vision algorithm and trained this algorithm from the dataset
which consists of 139 Pictures. Images were labeled using Intel CVAT (Computer
Vision Annotation Tool)
We trained this model for facial detection. We have deployed our trained
model and software in the Nvidia Jetson Nano Developer kit. Model code is
written in Pytorch's deep learning framework. The programming language used is
Python.
- Abstract(参考訳): 本稿では,コンピュータビジョンアルゴリズムSSD(Single Shot detector)コンピュータビジョンアルゴリズムを用いて,139枚の画像からなるデータセットからこのアルゴリズムを訓練した。
画像はIntel CVAT (Computer Vision Annotation Tool)を用いてラベル付けされた。
トレーニングされたモデルとソフトウェアをNvidia Jetson Nano Developer Kitにデプロイしました。
モデルコードはpytorchのディープラーニングフレームワークで記述されている。
プログラミング言語はpythonである。
関連論文リスト
- Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - 3D generation on ImageNet [76.0440752186121]
3DGP: トレーニングデータに関するより一般的な仮定を持つ3D合成フレームワークを開発した。
私たちのモデルは3つの新しいアイデアに基づいている。
SDIP Dogs 256x256, SDIP Elephants 256x256, LSUN Horses 256x256, ImageNet 256x256の4つのデータセットについて検討を行った。
論文 参考訳(メタデータ) (2023-03-02T17:06:57Z) - Efficient Self-supervised Learning with Contextualized Target
Representations for Vision, Speech and Language [60.12197397018094]
data2vecは学習目標であり、いくつかのモダリティにまたがって一般化します。
マスクされたトークンをエンコードしたり、高速な畳み込みデコーダを使ったり、教師表現の構築に力を注いだりはしません。
ImageNet-1K画像分類の実験では、Data2vec 2.0は16.4倍低いトレーニング時間でMasked Autoencodersの精度と一致している。
論文 参考訳(メタデータ) (2022-12-14T22:13:11Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Robustar: Interactive Toolbox Supporting Precise Data Annotation for
Robust Vision Learning [53.900911121695536]
ソフトウェアRobustarの初期リリースを紹介します。
それは、データ駆動の観点から視覚分類機械学習モデルの堅牢性を改善することを目的としている。
論文 参考訳(メタデータ) (2022-07-18T21:12:28Z) - Efficiency Comparison of AI classification algorithms for Image
Detection and Recognition in Real-time [0.0]
顔の検出と識別は、人工知能システムにおいて最も困難で頻繁に使用されるタスクである。
本研究は,システムにおける顔検出および認識アルゴリズムの結果を提示し,比較することを目的とする。
公共スペース、ショッピングモール、ATMブースなど、CCTVのある場所でも使用できる。
論文 参考訳(メタデータ) (2022-06-12T21:31:40Z) - Handwritten Digit Recognition Using Improved Bounding Box Recognition
Technique [0.0]
このプロジェクトにはOCR(Optical Character Recognition)の技術が組み込まれており、コンピュータ科学の様々な研究分野が含まれている。
このプロジェクトの目的は、キャラクターの写真を撮って処理して、人間の脳がさまざまな数字を認識するように、そのキャラクターのイメージを認識することだ。
このプロジェクトには、画像処理技術と機械学習の大きな研究領域と、ニューラルネットワークと呼ばれる機械学習のビルディングブロックの深いアイデアが含まれている。
論文 参考訳(メタデータ) (2021-11-10T01:53:34Z) - AVATAR: A Parallel Corpus for Java-Python Program Translation [77.86173793901139]
プログラム翻訳とは、ある言語から別の言語へソースコードを移行することを指す。
AVATARは9,515のプログラミング問題とそのソリューションをJavaとPythonという2つの人気のある言語で記述したものです。
論文 参考訳(メタデータ) (2021-08-26T05:44:20Z) - A Framework for Fast Scalable BNN Inference using Googlenet and Transfer
Learning [0.0]
本論文は、リアルタイム性能の良い物体検出の高精度化を目指します。
バイナライズニューラルネットワークは、画像分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな視覚タスクで高いパフォーマンスを発揮しています。
その結果,移動学習法により検出された物体の精度は,既存手法と比較して高いことがわかった。
論文 参考訳(メタデータ) (2021-01-04T06:16:52Z) - Satellite Image Classification with Deep Learning [0.0]
IARPA関数マップ(FMoW)データセットから対象物や施設を63のクラスに分類する深層学習システムについて述べる。
このシステムは、畳み込みニューラルネットワークと、衛星メタデータと画像特徴を統合する追加のニューラルネットワークのアンサンブルで構成されている。
執筆時点では、このシステムはfMoW TopCoderコンペティションで2位だ。
論文 参考訳(メタデータ) (2020-10-13T15:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。