論文の概要: Empirical Performance Analysis of Conventional Deep Learning Models for
Recognition of Objects in 2-D Images
- arxiv url: http://arxiv.org/abs/2011.06639v1
- Date: Thu, 12 Nov 2020 20:14:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 06:33:05.337734
- Title: Empirical Performance Analysis of Conventional Deep Learning Models for
Recognition of Objects in 2-D Images
- Title(参考訳): 2次元画像における物体認識のための従来型ディープラーニングモデルの経験的性能解析
- Authors: Sangeeta Satish Rao, Nikunj Phutela, V R Badri Prasad
- Abstract要約: 学習率,フィルタサイズ,隠蔽層数,ストライドサイズ,アクティベーション関数など,さまざまなパラメータを用いてモデルの性能を解析する。
モデルでは、画像は車、顔、飛行機の3つのカテゴリに分類される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Artificial Neural Networks, an essential part of Deep Learning, are derived
from the structure and functionality of the human brain. It has a broad range
of applications ranging from medical analysis to automated driving. Over the
past few years, deep learning techniques have improved drastically - models can
now be customized to a much greater extent by varying the network architecture,
network parameters, among others. We have varied parameters like learning rate,
filter size, the number of hidden layers, stride size and the activation
function among others to analyze the performance of the model and thus produce
a model with the highest performance. The model classifies images into 3
categories, namely, cars, faces and aeroplanes.
- Abstract(参考訳): ディープラーニングの重要な部分である人工ニューラルネットワークは、人間の脳の構造と機能から派生している。
医療分析から自動運転まで幅広い応用がある。
過去数年間で、ディープラーニングの技術は劇的に改善され、ネットワークアーキテクチャやネットワークパラメータなどを変化させることで、モデルをより広範囲にカスタマイズできるようになった。
我々は,学習率,フィルタサイズ,隠蔽層数,ストライドサイズ,アクティベーション関数などのパラメータを多用し,モデルの性能を分析し,最高性能のモデルを生成する。
モデルは画像を3つのカテゴリ、すなわち車、顔、飛行機に分類する。
関連論文リスト
- Towards Scalable and Versatile Weight Space Learning [51.78426981947659]
本稿では,重み空間学習におけるSANEアプローチを紹介する。
ニューラルネットワーク重みのサブセットの逐次処理に向けて,超表現の概念を拡張した。
論文 参考訳(メタデータ) (2024-06-14T13:12:07Z) - Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。
本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。
我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - A Comprehensive Overview and Comparative Analysis on Deep Learning Models: CNN, RNN, LSTM, GRU [0.40498500266986387]
機械学習(ML)と人工知能(AI)の強力なサブセットとして、ディープラーニング(DL)が登場した
その影響は、音声認識、ヘルスケア、自動運転車、サイバーセキュリティ、予測分析など、さまざまな分野に及んでいる。
我々は、CNN、リカレントニューラルネットワーク(RNN)、生成モデル、深層強化学習(DRL)、深層移動学習など、さまざまなディープラーニングモデルの総合的な調査を行う。
論文 参考訳(メタデータ) (2023-05-27T13:23:21Z) - IterMiUnet: A lightweight architecture for automatic blood vessel
segmentation [10.538564380139483]
本稿では,新しい軽量畳み込み型セグメンテーションモデルであるIterMiUnetを提案する。
MiUnetモデルのエンコーダ・デコーダ構造を組み込むことで、その非常にパラメトリズドな性質を克服する。
提案モデルは,多くの疾患の早期診断のためのツールとして活用される可能性が大きい。
論文 参考訳(メタデータ) (2022-08-02T14:33:14Z) - Revisiting Facial Key Point Detection: An Efficient Approach Using Deep
Neural Networks [0.0]
モデルサイズ,パラメータ,推論時間の観点から,効率的なディープラーニングモデルを構築した。
MobileNetV2アーキテクチャは最低のRMSEと推論時間を生み出した。
手動で最適化されたCNNアーキテクチャは、Auto Kerasのチューニングアーキテクチャと同様に実行された。
論文 参考訳(メタデータ) (2022-05-14T19:49:03Z) - 3D Neural Scene Representations for Visuomotor Control [78.79583457239836]
我々は2次元視覚観測から動的3次元シーンのモデルを純粋に学習する。
学習した表現空間上に構築された動的モデルにより,操作課題に対するビジュモータ制御が可能となる。
論文 参考訳(メタデータ) (2021-07-08T17:49:37Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z) - Deep Learning of Unified Region, Edge, and Contour Models for Automated
Image Segmentation [2.0305676256390934]
畳み込みニューラルネットワーク(CNN)は,自動セグメンテーションパイプラインの設計において注目を集めている。
CNNベースのモデルは、生の画像データから抽象的な特徴を学ぶには十分だが、それらのパフォーマンスは、適切なトレーニングデータセットの可用性とサイズに依存している。
本稿では,これらの問題に対処する新しい手法を考案し,完全自動セマンティックセマンティックセグメンテーションのための堅牢な表現学習フレームワークを構築した。
論文 参考訳(メタデータ) (2020-06-23T02:54:55Z) - Multi-task pre-training of deep neural networks for digital pathology [8.74883469030132]
私たちはまず、多くのデジタル病理データセットを22の分類タスクと約900kの画像のプールに組み立て、変換しました。
特徴抽出器として使用されるモデルは、ImageNet事前訓練されたモデルよりも大幅に改善されるか、同等のパフォーマンスを提供するかを示す。
論文 参考訳(メタデータ) (2020-05-05T08:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。