論文の概要: Accelerating Deep Learning Applications in Space
- arxiv url: http://arxiv.org/abs/2007.11089v1
- Date: Tue, 21 Jul 2020 21:06:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:49:17.174327
- Title: Accelerating Deep Learning Applications in Space
- Title(参考訳): 宇宙でのディープラーニング応用の加速
- Authors: Martina Lofqvist, Jos\'e Cano
- Abstract要約: 拘束デバイス上でのCNNを用いた物体検出の性能について検討する。
我々は、Single Shot MultiBox Detector (SSD)とリージョンベースのFully Convolutional Network (R-FCN)について詳しく検討する。
性能は、推測時間、メモリ消費、精度で測定される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computing at the edge offers intriguing possibilities for the development of
autonomy and artificial intelligence. The advancements in autonomous
technologies and the resurgence of computer vision have led to a rise in demand
for fast and reliable deep learning applications. In recent years, the industry
has introduced devices with impressive processing power to perform various
object detection tasks. However, with real-time detection, devices are
constrained in memory, computational capacity, and power, which may compromise
the overall performance. This could be solved either by optimizing the object
detector or modifying the images. In this paper, we investigate the performance
of CNN-based object detectors on constrained devices when applying different
image compression techniques. We examine the capabilities of a NVIDIA Jetson
Nano; a low-power, high-performance computer, with an integrated GPU, small
enough to fit on-board a CubeSat. We take a closer look at the Single Shot
MultiBox Detector (SSD) and Region-based Fully Convolutional Network (R-FCN)
that are pre-trained on DOTA - a Large Scale Dataset for Object Detection in
Aerial Images. The performance is measured in terms of inference time, memory
consumption, and accuracy. By applying image compression techniques, we are
able to optimize performance. The two techniques applied, lossless compression
and image scaling, improves speed and memory consumption with no or little
change in accuracy. The image scaling technique achieves a 100% runnable
dataset and we suggest combining both techniques in order to optimize the
speed/memory/accuracy trade-off.
- Abstract(参考訳): エッジでのコンピューティングは、自律性と人工知能の開発に興味深い可能性を提供します。
自動運転技術の進歩とコンピュータビジョンの復活は、高速で信頼性の高いディープラーニングアプリケーションに対する需要の高まりにつながった。
近年、業界は様々な物体検出タスクを実行するための処理能力を備えたデバイスを導入している。
しかし、リアルタイム検出では、デバイスはメモリ、計算能力、電力に制限され、全体的な性能を損なう可能性がある。
これは物体検出器の最適化や画像の変更によって解決できる。
本稿では,cnnを用いた物体検出装置の性能について,画像圧縮技術の違いについて検討する。
NVIDIA Jetson Nanoは低消費電力で高性能なコンピュータで、GPUを内蔵し、CubeSatに搭載できるほど小型である。
航空画像における物体検出のための大規模データセットであるdota上で事前学習されたsingle shot multibox detector (ssd) とリージョンベース完全畳み込みネットワーク (r-fcn) について詳しく検討する。
性能は、推論時間、メモリ消費、正確性の観点から測定される。
画像圧縮技術を適用することで、パフォーマンスを最適化できます。
ロスレス圧縮と画像スケーリングの2つのテクニックは、正確さをほとんど変更することなく、スピードとメモリ消費を改善する。
画像スケーリング技術は100%実行可能なデータセットを実現し,速度/メモリ/精度トレードオフを最適化するために両手法を組み合わせることを提案する。
関連論文リスト
- Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Feature Compression for Rate Constrained Object Detection on the Edge [20.18227104333772]
この問題を解決するための新たなアプローチは、ニューラルネットワークの計算をエッジサーバのコンピューティングリソースにオフロードすることだ。
本研究では、YOLOオブジェクト検出モデルの計算の一部をオフロードする「分割計算」システムについて検討する。
我々は、速度制約下でのオブジェクト検出精度を最適化するために、YOLOモデルとともに特徴圧縮および非圧縮モジュールを訓練する。
論文 参考訳(メタデータ) (2022-04-15T03:39:30Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - Oscillatory Neural Network as Hetero-Associative Memory for Image Edge
Detection [0.0]
画像エッジ検出のためのヘテロ連想メモリとして,ONNを用いた新しい画像処理手法を提案する。
この研究は、ONNを画像処理アプリケーションのためのヘテロ連想メモリとして探求した最初のものである。
論文 参考訳(メタデータ) (2022-02-25T08:09:29Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Optimizing Data Processing in Space for Object Detection in Satellite
Imagery [0.0]
衛星データに異なる画像圧縮技術を適用し, 拘束デバイス上でのCNNを用いた物体検出の性能について検討した。
我々は、Single Shot MultiBox Detector (SSD) やリージョンベースのFully Convolutional Network (R-FCN) モデルなど、オブジェクト検出ネットワークを詳しく検討する。
その結果、画像圧縮技術を適用することで、実行時間とメモリ消費を改善し、完全に実行可能なデータセットを実現することができることがわかった。
論文 参考訳(メタデータ) (2021-07-08T11:37:24Z) - Analysis of voxel-based 3D object detection methods efficiency for
real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。
実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。
この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文 参考訳(メタデータ) (2021-05-21T12:40:59Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - A Framework for Fast Scalable BNN Inference using Googlenet and Transfer
Learning [0.0]
本論文は、リアルタイム性能の良い物体検出の高精度化を目指します。
バイナライズニューラルネットワークは、画像分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな視覚タスクで高いパフォーマンスを発揮しています。
その結果,移動学習法により検出された物体の精度は,既存手法と比較して高いことがわかった。
論文 参考訳(メタデータ) (2021-01-04T06:16:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。