論文の概要: An FPGA smart camera implementation of segmentation models for drone
wildfire imagery
- arxiv url: http://arxiv.org/abs/2309.01318v1
- Date: Mon, 4 Sep 2023 02:30:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 20:14:24.744365
- Title: An FPGA smart camera implementation of segmentation models for drone
wildfire imagery
- Title(参考訳): FPGAスマートカメラによるドローン山火事画像のセグメンテーションモデルの実装
- Authors: Eduardo Guardu\~no-Martinez and Jorge Ciprian-Sanchez and Gerardo
Valente and Vazquez-Garcia and Gerardo Rodriguez-Hernandez and Adriana
Palacios-Rosas and Lucile Rossi-Tisson and Gilberto Ochoa-Ruiz
- Abstract要約: 森林火災は、様々な社会的・環境レベルへの影響から、世界有数の自然災害の1つとなっている。
ファイアファイアファイアの最も有望なアプローチの1つは、リモートで検出、監視、延焼評価を行うために可視・赤外線カメラを備えたドローンを使用することである。
本研究では,低消費電力フィールドプログラマブルゲートアレイ(FPGA)とバイナライズニューラルネットワーク(BNN)に基づくスマートカメラが,エッジ上でのオンボードコンピューティングの実装において,コスト効率のよい代替手段であることを示す。
- 参考スコア(独自算出の注目度): 0.9837190842240352
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wildfires represent one of the most relevant natural disasters worldwide, due
to their impact on various societal and environmental levels. Thus, a
significant amount of research has been carried out to investigate and apply
computer vision techniques to address this problem. One of the most promising
approaches for wildfire fighting is the use of drones equipped with visible and
infrared cameras for the detection, monitoring, and fire spread assessment in a
remote manner but in close proximity to the affected areas. However,
implementing effective computer vision algorithms on board is often prohibitive
since deploying full-precision deep learning models running on GPU is not a
viable option, due to their high power consumption and the limited payload a
drone can handle. Thus, in this work, we posit that smart cameras, based on
low-power consumption field-programmable gate arrays (FPGAs), in tandem with
binarized neural networks (BNNs), represent a cost-effective alternative for
implementing onboard computing on the edge. Herein we present the
implementation of a segmentation model applied to the Corsican Fire Database.
We optimized an existing U-Net model for such a task and ported the model to an
edge device (a Xilinx Ultra96-v2 FPGA). By pruning and quantizing the original
model, we reduce the number of parameters by 90%. Furthermore, additional
optimizations enabled us to increase the throughput of the original model from
8 frames per second (FPS) to 33.63 FPS without loss in the segmentation
performance: our model obtained 0.912 in Matthews correlation coefficient
(MCC),0.915 in F1 score and 0.870 in Hafiane quality index (HAF), and
comparable qualitative segmentation results when contrasted to the original
full-precision model. The final model was integrated into a low-cost FPGA,
which was used to implement a neural network accelerator.
- Abstract(参考訳): 森林火災は、様々な社会的・環境レベルへの影響から、世界有数の自然災害の1つである。
そこで,コンピュータビジョン技術を用いてこの問題に対処するための研究がかなりの量実施されている。
ワイルドファイアーファイアーの最も有望なアプローチの1つは、可視カメラと赤外線カメラを装備したドローンを使用して、リモートで検出、監視、および火の拡散評価を行う。
しかし、GPU上で動作する完全精度のディープラーニングモデルをデプロイすることは、高消費電力とドローンが扱える限られたペイロードのため、有効な選択肢ではないため、効果的なコンピュータビジョンアルゴリズムを実装することは、しばしば禁止される。
そこで本研究では、低消費電力フィールドプログラマブルゲートアレイ(FPGA)をベースとしたスマートカメラを、バイナライズニューラルネットワーク(BNN)と組み合わせることで、エッジ上でのオンボードコンピューティングを実装するためのコスト効率の良い代替手段であると仮定する。
本稿では,Corsican Fire Databaseに適用されたセグメンテーションモデルの実装について述べる。
このようなタスクのために既存のU-Netモデルを最適化し、エッジデバイス(Xilinx Ultra96-v2 FPGA)に移植した。
原モデルの定式化と定量化により,パラメータの数を90%削減する。
さらに,1秒間8フレーム (FPS) から33.63FPS (FPS) へのスループット向上を実現した。このモデルでは,マシューズ相関係数 (MCC) 0.912,F1スコアで0.915,Hafiane品質指標 (HAF) 0.870,および完全精度モデルと対照的な定性的セグメンテーション結果を得た。
最終モデルは低コストのFPGAに統合され、ニューラルネットワークアクセラレータの実装に使用された。
関連論文リスト
- Designing a Classifier for Active Fire Detection from Multispectral Satellite Imagery Using Neural Architecture Search [0.0]
本稿では、強化学習に基づくニューラルアーキテクチャサーチ(NAS)エージェントを用いて、小型ニューラルネットワークを設計し、マルチスペクトル衛星画像上でアクティブな火災検知を行う。
具体的には、単一マルチスペクトル画素が火災の一部かどうかを判断できるニューラルネットワークを設計し、低地球軌道(LEO)ナノサテライトの制約内で限られた電力予算で行うことを目的としている。
論文 参考訳(メタデータ) (2024-10-07T18:43:43Z) - Accurate, Low-latency, Efficient SAR Automatic Target Recognition on
FPGA [3.251765107970636]
合成開口レーダ(SAR)自動目標認識(ATR)はリモートセンシング画像認識の鍵となる技術である。
SAR ATRのための最先端の畳み込みニューラルネットワーク(CNN)は、エンハンハイ計算コストとエンハンラージメモリフットプリントに悩まされている。
本稿では,これらの問題に対処するため,FPGA 上でモデルアーキテクチャを包括的に設計する手法を提案する。
論文 参考訳(メタデータ) (2023-01-04T05:35:30Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Rethinking Deconvolution for 2D Human Pose Estimation Light yet Accurate
Model for Real-time Edge Computing [0.0]
このシステムは精度が高く、SOTA HRNet 256x192の94.5%の精度を達成した。
我々のモデルはエンコーダ・デコーダアーキテクチャを採用し、その効率を改善するために注意深く縮小されている。
論文 参考訳(メタデータ) (2021-11-08T01:44:46Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - EfficientPose: Efficient Human Pose Estimation with Neural Architecture
Search [47.30243595690131]
効率的なバックボーンと効率的なヘッドの2つの部分を含む、人間のポーズ推定を目的とした効率的なフレームワークを提案します。
我々の最小モデルは、MPIIで88.1%のPCKh@0.5の0.65 GFLOPしか持たず、我々の大モデルは2 GFLOPしか持たないが、その精度は最先端の大型モデルと競合する。
論文 参考訳(メタデータ) (2020-12-13T15:38:38Z) - KutralNet: A Portable Deep Learning Model for Fire Recognition [4.886882441164088]
火災認識のための浮動小数点演算(浮動小数点演算)の少ない新しいディープラーニングアーキテクチャを提案する。
また, 火災認識のための携帯型手法と, モデル計算コスト削減のための近代技術の利用を提案する。
私たちのモデルの1つは、FireNetよりも71%少ないパラメータを示しながら、競争精度とAUROCのパフォーマンスを示しています。
論文 参考訳(メタデータ) (2020-08-16T09:35:25Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z) - Highly Efficient Salient Object Detection with 100K Parameters [137.74898755102387]
そこで我々は,段階内および複数ステージのマルチスケール機能を効率的に活用するために,フレキシブルな畳み込みモジュールであるOctoConv(gOctConv)を提案する。
我々は、非常に軽量なモデル、すなわちCSNetを構築し、一般的なオブジェクト検出ベンチマークで、約0.2%(100k)の大規模モデルで同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-12T07:00:46Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。