論文の概要: Detecting Wildfire Flame and Smoke through Edge Computing using Transfer Learning Enhanced Deep Learning Models
- arxiv url: http://arxiv.org/abs/2501.08639v1
- Date: Wed, 15 Jan 2025 08:04:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-16 15:51:48.418628
- Title: Detecting Wildfire Flame and Smoke through Edge Computing using Transfer Learning Enhanced Deep Learning Models
- Title(参考訳): 伝達学習強化深層学習モデルを用いたエッジコンピューティングによる火炎・煙の検出
- Authors: Giovanny Vazquez, Shengjie Zhai, Mei Yang,
- Abstract要約: 本研究は、山火事の煙や炎を識別する対象検出器の性能を高める上で、トランスファーラーニング(TL)の重要性を裏付けるものである。
本稿では,D-Fire あるいは FASDD を初期目標データセットとして,AFSE をその後の段階として利用する2段階の TL 手法について検討する。
微調整により、TLは検出精度を大幅に向上し、平均平均精度(mAP@0.5)は79.2%まで向上し、トレーニング時間を短縮し、モデルの一般化性を高める。
- 参考スコア(独自算出の注目度): 7.222438368943405
- License:
- Abstract: Autonomous unmanned aerial vehicles (UAVs) integrated with edge computing capabilities empower real-time data processing directly on the device, dramatically reducing latency in critical scenarios such as wildfire detection. This study underscores Transfer Learning's (TL) significance in boosting the performance of object detectors for identifying wildfire smoke and flames, especially when trained on limited datasets, and investigates the impact TL has on edge computing metrics. With the latter focusing how TL-enhanced You Only Look Once (YOLO) models perform in terms of inference time, power usage, and energy consumption when using edge computing devices. This study utilizes the Aerial Fire and Smoke Essential (AFSE) dataset as the target, with the Flame and Smoke Detection Dataset (FASDD) and the Microsoft Common Objects in Context (COCO) dataset serving as source datasets. We explore a two-stage cascaded TL method, utilizing D-Fire or FASDD as initial stage target datasets and AFSE as the subsequent stage. Through fine-tuning, TL significantly enhances detection precision, achieving up to 79.2% mean Average Precision (mAP@0.5), reduces training time, and increases model generalizability across the AFSE dataset. However, cascaded TL yielded no notable improvements and TL alone did not benefit the edge computing metrics evaluated. Lastly, this work found that YOLOv5n remains a powerful model when lacking hardware acceleration, finding that YOLOv5n can process images nearly twice as fast as its newer counterpart, YOLO11n. Overall, the results affirm TL's role in augmenting the accuracy of object detectors while also illustrating that additional enhancements are needed to improve edge computing performance.
- Abstract(参考訳): エッジコンピューティング機能と統合された自律無人航空機(UAV)は、デバイス上でのリアルタイムデータ処理を強化し、山火事検出などの重要なシナリオにおける遅延を劇的に低減する。
本研究は,特に限られたデータセットで訓練した場合に,山火事の煙や炎を識別するための物体検知器の性能を高める上で,Transfer Learning(TL)の意義を強調し,TLがエッジコンピューティングメトリクスに与える影響について検討する。
後者では、エッジコンピューティングデバイスを使用する際の推論時間、電力使用量、エネルギー消費の観点で、TL-enhanced You Only Look Once (YOLO)モデルがどのように機能するかに焦点を当てている。
本研究では、Aerial Fire and Smoke Essential(AFSE)データセットをターゲットとして、Flame and Smoke Detection Dataset(FASDD)とMicrosoft Common Objects in Context(COCO)データセットをソースデータセットとして使用した。
本稿では,D-Fire あるいは FASDD を初期目標データセットとして,AFSE をその後の段階として利用する2段階の TL 手法について検討する。
微調整により、TLは検出精度を大幅に向上し、平均平均平均精度(mAP@0.5)を79.2%まで達成し、トレーニング時間を短縮し、AFSEデータセット全体のモデル一般化性を高める。
しかし、カスケードTLは顕著な改善を得られず、TLだけでは評価されたエッジコンピューティングメトリクスに利益が得られなかった。
最後に、この研究により、YOLOv5nはハードウェアアクセラレーションの欠如において強力なモデルであり続けており、YOLOv5nは最新のYOLO11nの約2倍の速度で画像を処理できることがわかった。
その結果,対象検出器の精度を高める上でTLが果たす役割を裏付けるとともに,エッジコンピューティングの性能向上にはさらなる拡張が必要であることが示唆された。
関連論文リスト
- Rapid Wildfire Hotspot Detection Using Self-Supervised Learning on Temporal Remote Sensing Data [0.12289361708127873]
衛星ネットワークや高度なAIモデルからリモートセンシングされたデータを活用して、ホットスポットを自動的に検出することは、山火事モニタリングシステムを構築する効果的な方法である。
本稿では,欧州の火災イベントに関連するリモートセンシングデータの時系列を含む新しいデータセットと,多時期データを解析し,潜在的にほぼリアルタイムにホットスポットを識別できる自己監視学習(SSL)モデルを提案する。
我々は、我々のデータセットといくつかの火災イベントを含む熱異常のデータセットであるThrawsを用いて、モデルの性能を訓練し、評価し、F1スコア63.58を得る。
論文 参考訳(メタデータ) (2024-05-30T14:31:46Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Energy-Efficient Edge Learning via Joint Data Deepening-and-Prefetching [9.468399367975984]
我々は、JD2P(Joint Data Deepening-and-Prefetching)と呼ばれる新しいオフロードアーキテクチャを提案する。
JD2Pは2つの主要な技術からなる機能ごとのオフロードである。
MNISTデータセットを用いてJD2Pの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-19T08:12:47Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - LightESD: Fully-Automated and Lightweight Anomaly Detection Framework
for Edge Computing [3.096615629099617]
異常検出は、サイバーセキュリティから製造業、金融など、幅広い領域で広く使われている。
ディープラーニングに基づく異常検出は、複雑なデータパターンを認識し、アウトリーチを正確に識別する能力に優れており、最近多くの注目を集めている。
我々は,LightESDと呼ばれる完全自動,軽量,統計的学習に基づく異常検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-20T18:48:41Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。