論文の概要: An Acceleration Method Based on Deep Learning and Multilinear Feature
Space
- arxiv url: http://arxiv.org/abs/2110.08679v1
- Date: Sat, 16 Oct 2021 23:49:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 16:32:15.103718
- Title: An Acceleration Method Based on Deep Learning and Multilinear Feature
Space
- Title(参考訳): 深層学習と多線形特徴空間に基づく加速度法
- Authors: Michel Vinagreiro Edson Kitani Armando Lagana Leopoldo Yoshioka
- Abstract要約: 本稿では,大規模CNNアーキテクチャからの学習を伝達するために,Multilinear Feature Space (MFS)法に基づく代替手法を提案する。
提案手法はCNNを用いて特徴マップを生成するが,複雑性低減手法として機能しない。
AMFCと呼ばれる本手法では,事前学習したCNNからの移動学習を用いて,新しいサンプル画像の分類時間を最小限に抑える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computer vision plays a crucial role in Advanced Assistance Systems. Most
computer vision systems are based on Deep Convolutional Neural Networks (deep
CNN) architectures. However, the high computational resource to run a CNN
algorithm is demanding. Therefore, the methods to speed up computation have
become a relevant research issue. Even though several works on architecture
reduction found in the literature have not yet been achieved satisfactory
results for embedded real-time system applications. This paper presents an
alternative approach based on the Multilinear Feature Space (MFS) method
resorting to transfer learning from large CNN architectures. The proposed
method uses CNNs to generate feature maps, although it does not work as
complexity reduction approach. After the training process, the generated
features maps are used to create vector feature space. We use this new vector
space to make projections of any new sample to classify them. Our method, named
AMFC, uses the transfer learning from pre-trained CNN to reduce the
classification time of new sample image, with minimal accuracy loss. Our method
uses the VGG-16 model as the base CNN architecture for experiments; however,
the method works with any similar CNN model. Using the well-known Vehicle Image
Database and the German Traffic Sign Recognition Benchmark, we compared the
classification time of the original VGG-16 model with the AMFC method, and our
method is, on average, 17 times faster. The fast classification time reduces
the computational and memory demands in embedded applications requiring a large
CNN architecture.
- Abstract(参考訳): コンピュータビジョンは高度な援助システムにおいて重要な役割を果たす。
ほとんどのコンピュータビジョンシステムはDeep Convolutional Neural Networks (Deep CNN)アーキテクチャに基づいている。
しかし、CNNアルゴリズムを実行するための高い計算資源が要求されている。
そのため、計算を高速化する手法が研究課題となっている。
文献で見つかったアーキテクチャの削減に関するいくつかの研究は、組み込みリアルタイムシステムアプリケーションにはまだ満足な結果が得られていない。
本稿では,大規模CNNアーキテクチャからの学習を伝達するマルチ線形特徴空間(MFS)法に基づく代替手法を提案する。
提案手法はCNNを用いて特徴マップを生成するが,複雑性低減手法として機能しない。
トレーニングプロセスの後、生成された特徴マップを使用してベクトル特徴空間を生成する。
新しいベクトル空間を使って、新しいサンプルの投影を行い、それらを分類します。
提案手法であるamfcは,事前学習したcnnからの転送学習を用いて,新しいサンプル画像の分類時間を最小精度の損失で短縮する。
本手法は,実験の基盤となるCNNアーキテクチャとしてVGG-16モデルを用いるが,類似のCNNモデルでは動作しない。
車両画像データベースとドイツ交通信号認識ベンチマークを用いて,元のVGG-16モデルの分類時刻をAMFC法と比較し,平均17倍高速であることを確認した。
高速な分類時間は、大規模なcnnアーキテクチャを必要とする組み込みアプリケーションの計算とメモリ要求を削減する。
関連論文リスト
- Training Convolutional Neural Networks with the Forward-Forward
algorithm [1.74440662023704]
Forward Forward (FF)アルゴリズムは、現在まで完全に接続されたネットワークでしか使われていない。
FFパラダイムをCNNに拡張する方法を示す。
我々のFF学習したCNNは、空間的に拡張された新しいラベリング手法を特徴とし、MNISTの手書き桁データセットにおいて99.16%の分類精度を実現している。
論文 参考訳(メタデータ) (2023-12-22T18:56:35Z) - Transferability of Convolutional Neural Networks in Stationary Learning
Tasks [96.00428692404354]
本稿では,大規模な空間問題に対する畳み込みニューラルネットワーク(CNN)の効率的なトレーニングのための新しいフレームワークを提案する。
このような信号の小さなウィンドウで訓練されたCNNは、再学習することなく、はるかに大きなウィンドウでほぼ性能を発揮することを示す。
以上の結果から,CNNは10人未満の訓練を受けた後,数百人のエージェントによる問題に対処できることが示唆された。
論文 参考訳(メタデータ) (2023-07-21T13:51:45Z) - A Domain Decomposition-Based CNN-DNN Architecture for Model Parallel Training Applied to Image Recognition Problems [0.0]
モデル並列トレーニング戦略を自然にサポートする新しいCNN-DNNアーキテクチャを提案する。
提案手法は,グローバルモデルと比較して,必要なトレーニング時間を著しく短縮することができる。
その結果,提案手法は,基礎となる分類問題の精度向上にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-02-13T18:06:59Z) - FlowNAS: Neural Architecture Search for Optical Flow Estimation [65.44079917247369]
本研究では,フロー推定タスクにおいて,より優れたエンコーダアーキテクチャを自動で見つけるために,FlowNASというニューラルアーキテクチャ探索手法を提案する。
実験の結果、スーパーネットワークから受け継いだ重み付きアーキテクチャは、KITTI上で4.67%のF1-allエラーを達成していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T09:05:25Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - A Novel Sleep Stage Classification Using CNN Generated by an Efficient
Neural Architecture Search with a New Data Processing Trick [4.365107026636095]
本稿では,畳み込みニューラルネットワーク(CNN)を用いた新しいデータ処理手法を用いて,効率的な5ステップの分類手法を提案する。
我々は、遺伝的アルゴリズム(GA)NASGを最大限に活用して、最高のCNNアーキテクチャを探索する。
我々は,データ処理トリックの収束性を検証するとともに,従来のCNNの性能をそのトリックの前後で比較する。
論文 参考訳(メタデータ) (2021-10-27T10:36:52Z) - Boggart: Accelerating Retrospective Video Analytics via Model-Agnostic
Ingest Processing [5.076419064097734]
Boggartは、モデルに依存しない方法で摂取時のスピードアップを提供する、振り返りビデオ分析システムである。
我々の根底にある洞察は、従来のコンピュータビジョン(CV)アルゴリズムは、幅広いCNNで多様なクエリを高速化するために使用できる計算を行うことができるということである。
クエリ時に、Boggart氏はいくつかの新しいテクニックを使用して、ターゲットの精度を満たすのに必要な最小のCNN結果のサンプルを収集している。
論文 参考訳(メタデータ) (2021-06-21T19:21:16Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Learning CNN filters from user-drawn image markers for coconut-tree
image classification [78.42152902652215]
本稿では,CNNの特徴抽出器を訓練するために,最小限のユーザ選択画像を必要とする手法を提案する。
本手法は,クラスを識別する画像領域のユーザ描画マーカーから,各畳み込み層のフィルタを学習する。
バックプロパゲーションに基づく最適化には依存せず、ココナッツツリー空中画像のバイナリ分類にその利点を実証する。
論文 参考訳(メタデータ) (2020-08-08T15:50:23Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Convolution Neural Network Architecture Learning for Remote Sensing
Scene Classification [22.29957803992306]
本稿では,リモートセンシングシーン分類のためのアーキテクチャ学習手法を提案する。
本稿では,勾配降下法を用いてアーキテクチャ空間の効率的な探索を可能にする学習戦略を提案する。
アーキテクチャジェネレータは、最終的にパラメータのセットを実験で使用されるCNNにマッピングします。
論文 参考訳(メタデータ) (2020-01-27T07:42:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。