論文の概要: A reconfigurable smart camera implementation for jet flames characterization based on an optimized segmentation model
- arxiv url: http://arxiv.org/abs/2604.03267v1
- Date: Thu, 19 Mar 2026 22:17:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.574885
- Title: A reconfigurable smart camera implementation for jet flames characterization based on an optimized segmentation model
- Title(参考訳): 最適化セグメンテーションモデルに基づくジェット火炎評価のための再構成可能なスマートカメラの実装
- Authors: Gerardo Valente Vazquez-Garcia, Carmina Perez Guerrero, Eduardo Garduño, Miguel Gonzalez-Mendoza, Adriana Palacios, Gerardo Rodriguez-Hernandez, Vahid Foroughi, Alba Àgueda, Elsa Pastor, Gilberto Ochoa-Ruiz,
- Abstract要約: 本稿では, ジェット火炎評価のためのスマートカメラプラットフォームの実装を通じて, 産業環境における火災安全管理のための新しい枠組みを提案する。
この手法は、産業の初期火の分断とキャラクタリゼーションのためのリアルタイムソリューションの欠如を軽減することを目的としている。
- 参考スコア(独自算出の注目度): 3.4681991924082003
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we present a novel framework for fire safety management in industrial settings through the implementation of a smart camera platform for jet flames characterization. The approach seeks to alleviate the lack of real-time solutions for industrial early fire segmentation and characterization. As a case study, we demonstrate how a SoC FPGA, running optimized Artificial Intelligence (AI) models can be leveraged to implement a full edge processing pipeline for jet flames analysis. In this paper we extend previous work on computer-vision jet fire segmentation by creating a novel experimental set-up and system implementation for addressing this issue, which can be replicated to other fire safety applications. The proposed platform is designed to carry out image processing tasks in real-time and on device, reducing video processing overheads, and thus the overall latency. This is achieved by optimizing a UNet segmentation model to make it amenable for an SoC FPGAs implementation; the optimized model can then be efficiently mapped onto the SoC reconfigurable logic for massively parallel execution. For our experiments, we have chosen the Ultra96 platform, as it also provides the means for implementing full-fledged intelligent systems using the SoC peripherals, as well as other Operating System (OS) capabilities (i.e., multi-threading) for systems management. For optimizing the model we made use of the Vitis (Xilinx) framework, which enabled us to optimize the full precision model from 7.5 million parameters to 59,095 parameters (125x less), which translated into a reduction of the processing latency of 2.9x. Further optimization (multi-threading and batch normalization) led to an improvement of 7.5x in terms of latency, yielding a performance of 30 Frames Per Second (FPS) without sacrificing accuracy in terms of the evaluated metrics (Dice Score).
- Abstract(参考訳): 本研究では, ジェット火炎評価のためのスマートカメラプラットフォームの実装を通じて, 産業環境における火災安全管理のための新しい枠組みを提案する。
この手法は、産業の初期火の分断とキャラクタリゼーションのためのリアルタイムソリューションの欠如を軽減することを目的としている。
ケーススタディでは、最適化された人工知能(AI)モデルを実行するSoC FPGAが、ジェット火炎解析のためのフルエッジ処理パイプラインの実装にどのように活用できるかを実証する。
本稿では,この問題に対処するための新しい実験装置とシステム実装を作成し,コンピュータビジョンジェット火災セグメンテーションに関する以前の研究を拡張し,他の火災安全アプリケーションに再現する。
提案するプラットフォームは,画像処理タスクをリアルタイムおよびデバイス上で実行し,ビデオ処理のオーバーヘッドを低減し,全体としてのレイテンシを低減するように設計されている。
これは、UNetセグメンテーションモデルを最適化してSoC FPGAの実装に利用可能にすることで実現される。
我々の実験ではUltra96プラットフォームを選択し、SoC周辺機器を使用した本格的なインテリジェントシステムの実装方法や、システム管理のための他のオペレーティングシステム(OS)機能(マルチスレッド)も提供しました。
モデルの最適化にはVitis(Xilinx)フレームワークを使用し、750万のパラメータから59,095のパラメータ(125倍)までの完全な精度モデルを最適化し、処理遅延を2.9倍に削減しました。
さらなる最適化(マルチスレッドとバッチの正規化)によりレイテンシは7.5倍改善され、評価されたメトリクス(Dice Score)の精度を犠牲にすることなく、30フレーム/秒(FPS)のパフォーマンスが得られた。
関連論文リスト
- Diff3R: Feed-forward 3D Gaussian Splatting with Uncertainty-aware Differentiable Optimization [76.38917994186733]
Diff3Rはフィードフォワード予測とテストタイム最適化をブリッジする新しいフレームワークである。
フィードフォワード3DGSアーキテクチャにシームレスに統合でき、ポーズギヴン法とポーズフリー法の両方に対応できることを示す。
論文 参考訳(メタデータ) (2026-04-01T15:40:20Z) - CLIDD: Cross-Layer Independent Deformable Description for Efficient and Discriminative Local Feature Representation [6.478456907626643]
CLIDD (Cross-Layer Independent Deformable Description) は、独立な特徴階層から直接サンプリングすることで、優れた特徴性を実現する手法である。
リアルタイム性能を確保するため,ハードウェア対応のカーネル融合戦略を実装した。
軽量アーキテクチャとトレーニングプロトコルを統合するスケーラブルなフレームワークを開発する。
論文 参考訳(メタデータ) (2026-01-14T07:03:01Z) - SkyEgg: Joint Implementation Selection and Scheduling for Hardware Synthesis using E-graphs [2.363352915727704]
実装の選択とスケジューリングを協調的に最適化する新しいハードウェア合成フレームワークSkyEggを提案する。
SkyEggはVitisで平均3.01倍のスピードアップを実現し、複雑な式では5.22倍に改善されている。
論文 参考訳(メタデータ) (2025-11-19T10:39:45Z) - Rethinking Autoregressive Models for Lossless Image Compression via Hierarchical Parallelism and Progressive Adaptation [75.58269386927076]
自己回帰(AR)モデルは、しばしば計算コストの禁止のために非現実的に除外される。
この研究は、階層的並列性とプログレッシブ適応に基づくフレームワークを導入して、このパラダイムを再考する。
各種データセット(自然,衛星,医療)の実験により,本手法が新たな最先端圧縮を実現することを確認した。
論文 参考訳(メタデータ) (2025-11-14T06:27:58Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Hardware-Software Co-optimised Fast and Accurate Deep Reconfigurable Spiking Inference Accelerator Architecture Design Methodology [2.968768532937366]
Spiking Neural Networks(SNN)は、機械学習モデルのエネルギー効率を改善するための有望なアプローチとして登場した。
我々は,ソフトウェア学習深層ニューラルネットワーク(DNN)を高精度スパイキングモデルに移植するハードウェア・ソフトウェア共同最適化戦略を開発した。
論文 参考訳(メタデータ) (2024-10-07T05:04:13Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Virtuoso: Video-based Intelligence for real-time tuning on SOCs [24.086595996055074]
Underlying Virtuosoはマルチブランチ実行カーネルで、精度-エネルギー-遅延軸の異なる動作ポイントで実行することができる。
我々は、Faster R-CNN (FRCNN)、YOLO v3、SSD、EfficientDet、SELSA、MEGA、REPP、FastAdapt、およびFRCNN+、YOLO+、SSD+、EfficientDet+を含む15の最先端または広く使用されているプロトコルをベンチマークする。
論文 参考訳(メタデータ) (2021-12-24T14:47:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。