論文の概要: Accelerating Deep Learning Applications in Space
- arxiv url: http://arxiv.org/abs/2007.11089v1
- Date: Tue, 21 Jul 2020 21:06:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:49:17.174327
- Title: Accelerating Deep Learning Applications in Space
- Title(参考訳): 宇宙でのディープラーニング応用の加速
- Authors: Martina Lofqvist, Jos\'e Cano
- Abstract要約: 拘束デバイス上でのCNNを用いた物体検出の性能について検討する。
我々は、Single Shot MultiBox Detector (SSD)とリージョンベースのFully Convolutional Network (R-FCN)について詳しく検討する。
性能は、推測時間、メモリ消費、精度で測定される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computing at the edge offers intriguing possibilities for the development of
autonomy and artificial intelligence. The advancements in autonomous
technologies and the resurgence of computer vision have led to a rise in demand
for fast and reliable deep learning applications. In recent years, the industry
has introduced devices with impressive processing power to perform various
object detection tasks. However, with real-time detection, devices are
constrained in memory, computational capacity, and power, which may compromise
the overall performance. This could be solved either by optimizing the object
detector or modifying the images. In this paper, we investigate the performance
of CNN-based object detectors on constrained devices when applying different
image compression techniques. We examine the capabilities of a NVIDIA Jetson
Nano; a low-power, high-performance computer, with an integrated GPU, small
enough to fit on-board a CubeSat. We take a closer look at the Single Shot
MultiBox Detector (SSD) and Region-based Fully Convolutional Network (R-FCN)
that are pre-trained on DOTA - a Large Scale Dataset for Object Detection in
Aerial Images. The performance is measured in terms of inference time, memory
consumption, and accuracy. By applying image compression techniques, we are
able to optimize performance. The two techniques applied, lossless compression
and image scaling, improves speed and memory consumption with no or little
change in accuracy. The image scaling technique achieves a 100% runnable
dataset and we suggest combining both techniques in order to optimize the
speed/memory/accuracy trade-off.
- Abstract(参考訳): エッジでのコンピューティングは、自律性と人工知能の開発に興味深い可能性を提供します。
自動運転技術の進歩とコンピュータビジョンの復活は、高速で信頼性の高いディープラーニングアプリケーションに対する需要の高まりにつながった。
近年、業界は様々な物体検出タスクを実行するための処理能力を備えたデバイスを導入している。
しかし、リアルタイム検出では、デバイスはメモリ、計算能力、電力に制限され、全体的な性能を損なう可能性がある。
これは物体検出器の最適化や画像の変更によって解決できる。
本稿では,cnnを用いた物体検出装置の性能について,画像圧縮技術の違いについて検討する。
NVIDIA Jetson Nanoは低消費電力で高性能なコンピュータで、GPUを内蔵し、CubeSatに搭載できるほど小型である。
航空画像における物体検出のための大規模データセットであるdota上で事前学習されたsingle shot multibox detector (ssd) とリージョンベース完全畳み込みネットワーク (r-fcn) について詳しく検討する。
性能は、推論時間、メモリ消費、正確性の観点から測定される。
画像圧縮技術を適用することで、パフォーマンスを最適化できます。
ロスレス圧縮と画像スケーリングの2つのテクニックは、正確さをほとんど変更することなく、スピードとメモリ消費を改善する。
画像スケーリング技術は100%実行可能なデータセットを実現し,速度/メモリ/精度トレードオフを最適化するために両手法を組み合わせることを提案する。
関連論文リスト
- Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Taming Lookup Tables for Efficient Image Retouching [30.48643578900116]
我々は、畳み込みニューラルネットワーク(CNN)を使わずに、極めて効率的なエッジ推論にLUTを採用するICELUTを提案する。
ICELUTは最先端の性能と極めて低消費電力を実現している。
これにより、最初のLUTベースのイメージエンハンサーであるICELUTは、GPUでは0.4ms、CPUでは7msという前例のない速度に達し、CNNソリューションよりも少なくとも1桁高速になる。
論文 参考訳(メタデータ) (2024-03-28T08:49:35Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Feature Compression for Rate Constrained Object Detection on the Edge [20.18227104333772]
この問題を解決するための新たなアプローチは、ニューラルネットワークの計算をエッジサーバのコンピューティングリソースにオフロードすることだ。
本研究では、YOLOオブジェクト検出モデルの計算の一部をオフロードする「分割計算」システムについて検討する。
我々は、速度制約下でのオブジェクト検出精度を最適化するために、YOLOモデルとともに特徴圧縮および非圧縮モジュールを訓練する。
論文 参考訳(メタデータ) (2022-04-15T03:39:30Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Optimizing Data Processing in Space for Object Detection in Satellite
Imagery [0.0]
衛星データに異なる画像圧縮技術を適用し, 拘束デバイス上でのCNNを用いた物体検出の性能について検討した。
我々は、Single Shot MultiBox Detector (SSD) やリージョンベースのFully Convolutional Network (R-FCN) モデルなど、オブジェクト検出ネットワークを詳しく検討する。
その結果、画像圧縮技術を適用することで、実行時間とメモリ消費を改善し、完全に実行可能なデータセットを実現することができることがわかった。
論文 参考訳(メタデータ) (2021-07-08T11:37:24Z) - Analysis of voxel-based 3D object detection methods efficiency for
real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。
実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。
この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文 参考訳(メタデータ) (2021-05-21T12:40:59Z) - A Framework for Fast Scalable BNN Inference using Googlenet and Transfer
Learning [0.0]
本論文は、リアルタイム性能の良い物体検出の高精度化を目指します。
バイナライズニューラルネットワークは、画像分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな視覚タスクで高いパフォーマンスを発揮しています。
その結果,移動学習法により検出された物体の精度は,既存手法と比較して高いことがわかった。
論文 参考訳(メタデータ) (2021-01-04T06:16:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。