論文の概要: Lightweight Transformer-Driven Segmentation of Hotspots and Snail Trails in Solar PV Thermal Imagery
- arxiv url: http://arxiv.org/abs/2507.20680v1
- Date: Mon, 28 Jul 2025 10:05:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.077969
- Title: Lightweight Transformer-Driven Segmentation of Hotspots and Snail Trails in Solar PV Thermal Imagery
- Title(参考訳): ソーラーPV熱画像におけるホットスポットとスネールトレイルの軽量変圧器駆動セグメンテーション
- Authors: Deepak Joshi, Mayukha Pal,
- Abstract要約: 本研究では、PVパネルの熱赤外画像のセグメント化のための教師付きディープラーニングフレームワークを提案する。
我々は、DJI Matrice 100ドローンに搭載されたゼンミューズXT赤外線カメラによって撮影された277の空中サーモグラフィー画像のデータセットを使用する。
SegFormerをベースとした軽量なセマンティックセグメンテーションモデルが開発され、カスタマイズされたTransformwerエンコーダと合理化されたデコーダを備えている。
- 参考スコア(独自算出の注目度): 1.6574413179773764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate detection of defects such as hotspots and snail trails in photovoltaic modules is essential for maintaining energy efficiency and system reliablility. This work presents a supervised deep learning framework for segmenting thermal infrared images of PV panels, using a dataset of 277 aerial thermographic images captured by zenmuse XT infrared camera mounted on a DJI Matrice 100 drone. The preprocessing pipeline includes image resizing, CLAHE based contrast enhancement, denoising, and normalisation. A lightweight semantic segmentation model based on SegFormer is developed, featuring a customised Transformwer encoder and streamlined decoder, and fine-tuned on annotated images with manually labeled defect regions. To evaluate performance, we benchmark our model against U-Net, DeepLabV3, PSPNet, and Mask2Former using consistent preprocessing and augmentation. Evaluation metrices includes per-class Dice score, F1-score, Cohen's kappa, mean IoU, and pixel accuracy. The SegFormer-based model outperforms baselines in accuracy and efficiency, particularly for segmenting small and irregular defects. Its lightweight design real-time deployment on edge devices and seamless integration with drone-based systems for automated inspection of large-scale solar farms.
- Abstract(参考訳): 太陽電池モジュールにおけるホットスポットやスネールトレイルなどの欠陥の正確な検出は、エネルギー効率とシステムの信頼性を維持するために不可欠である。
本研究は、DJI Matrice 100ドローンに搭載されたゼンミューズXT赤外線カメラで捉えた277個の空中熱画像を用いて、PVパネルの熱赤外画像のセグメンテーションを行うための教師付きディープラーニングフレームワークを提案する。
プリプロセッシングパイプラインは、画像リサイズ、CLAHEベースのコントラストエンハンスメント、デノナイジング、および正規化を含む。
SegFormerをベースとした軽量なセマンティックセグメンテーションモデルが開発され、カスタマイズされたTransformwerエンコーダと合理化されたデコーダを備え、手動でラベル付き欠陥領域を持つ注釈付き画像に微調整される。
性能を評価するため,一貫した前処理と拡張を用いて,U-Net,DeepLabV3,PSPNet,Mask2Formerに対してベンチマークを行った。
評価基準には、クラスごとのDiceスコア、F1スコア、コーエンのカッパ、平均IoU、ピクセル精度が含まれる。
SegFormerベースのモデルは、特に小さな欠陥と不規則な欠陥のセグメンテーションにおいて、精度と効率においてベースラインを上回っている。
その軽量な設計はエッジデバイスへのリアルタイム展開と、大規模ソーラーファームの自動検査のためのドローンベースのシステムとのシームレスな統合を実現している。
関連論文リスト
- Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery [0.0]
リモートセンシング画像から災害影響領域のセグメンテーションを洗練するための視覚変換器(ViT)ベースのディープラーニングフレームワークを提案する。
本フレームワークはセグメント化結果のスムーズさと信頼性を向上し,正確な地下真実が得られない場合の災害対応にスケーラブルなアプローチを提供する。
論文 参考訳(メタデータ) (2025-07-21T07:48:07Z) - Your ViT is Secretly an Image Segmentation Model [50.71238842539735]
Vision Transformer (ViT) は、様々なコンピュータビジョンタスクにおいて、顕著なパフォーマンスとスケーラビリティを示している。
タスク固有のコンポーネントによって導入された帰納バイアスは、代わりにViT自身で学習できることを示す。
画像セグメンテーションを行うためにプレーンな ViT アーキテクチャを再利用した Mask Transformer (EoMT) を導入する。
論文 参考訳(メタデータ) (2025-03-24T19:56:02Z) - Prior-guided Hierarchical Harmonization Network for Efficient Image Dehazing [50.92820394852817]
画像復調のためのtextitPrior-textitguided textitHarmonization Network (PGH$2$Net) を提案する。
PGH$2$Netは、2つのモジュールタイプからなる効率的なエンコーダとデコーダを備えたUNetのようなアーキテクチャ上に構築されている。
論文 参考訳(メタデータ) (2025-03-03T03:36:30Z) - DemosaicFormer: Coarse-to-Fine Demosaicing Network for HybridEVS Camera [70.28702677370879]
Hybrid Event-Based Vision Sensor (HybridEVS)は、従来のフレームベースとイベントベースのセンサーを統合する新しいセンサーである。
その可能性にもかかわらず、ハイブリッドEVS用に特別に設計された画像信号処理(ISP)パイプラインの欠如は大きな課題である。
粗大な復調と画素補正を含む,粗大で微細なフレームワークであるDemosaicFormerを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:20:46Z) - Combining UPerNet and ConvNeXt for Contrails Identification to reduce
Global Warming [0.0]
本研究は,地球規模の衛星画像における航空機のコントラル検出に着目し,コントラルモデルの改善と気候変動への影響を緩和する。
NOAA GOES-16衛星画像のための革新的なデータ前処理技術を開発した。
クラス不均衡に取り組むために、トレーニングデータセットは、正の反則ラベルを持つイメージのみを含む。
論文 参考訳(メタデータ) (2023-10-07T13:59:05Z) - Inheriting Bayer's Legacy-Joint Remosaicing and Denoising for Quad Bayer
Image Sensor [10.36002828484577]
ピクセルビンニングをベースとしたQuadセンサーは、低照度撮像におけるコンパクトカメラのハードウェア制限を克服する、有望なソリューションとして登場した。
そこで本稿では,ノイズフリーベイアパターンとノイズフリーベイアパターンの変換が可能なデュアルヘッド継手消音ネットワーク(DJRD)を提案する。
提案手法は,ハードウェアやソフトウェアの複雑さを伴わずに,約3dBの競合モデルよりも優れている。
論文 参考訳(メタデータ) (2023-03-23T16:16:50Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Skip-Attention: Improving Vision Transformers by Paying Less Attention [55.47058516775423]
視覚計算変換器(ViT)は、すべての層で高価な自己注意操作を使用する。
また,SkipAtを提案する。SkipAtは,先行層から自己注意を再利用して1層以上の注意を近似する手法である。
本稿では,画像の分類と自己教師型学習,ADE20Kのセマンティックセグメンテーション,SIDDの画像デノイング,DAVISのビデオデノナイズにおける手法の有効性を示す。
論文 参考訳(メタデータ) (2023-01-05T18:59:52Z) - Toward Efficient Hyperspectral Image Processing inside Camera Pixels [1.6449390849183356]
ハイパースペクトルカメラは、数百のスペクトル帯が存在するため、大量のデータを生成する。
この問題を軽減するために,PIP (Processing-in-Pixel) 形式を提案する。
我々のPIP最適化カスタムCNN層は、入力データを効果的に圧縮し、データをHSI処理ユニットに送信するために必要な帯域幅を大幅に削減する。
論文 参考訳(メタデータ) (2022-03-11T01:06:02Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Improved Transformer for High-Resolution GANs [69.42469272015481]
この課題に対処するために、Transformerに2つの重要な要素を紹介します。
実験で提案したHiTは、条件のないImageNetの31.87と2.95のFIDスコアをそれぞれ128×128$とFFHQの256×256$で達成していることを示す。
論文 参考訳(メタデータ) (2021-06-14T17:39:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。