論文の概要: Attention-Guided Autoencoder Fusion for Insulator Defect Detection Using UAV Transmission-Line Imaging
- arxiv url: http://arxiv.org/abs/2606.06536v1
- Date: Wed, 03 Jun 2026 21:56:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.353288
- Title: Attention-Guided Autoencoder Fusion for Insulator Defect Detection Using UAV Transmission-Line Imaging
- Title(参考訳): UAV透過線イメージングによる絶縁体欠陥検出のためのアテンションガイドオートエンコーダフュージョン
- Authors: Malak Allam, Khaled Shaban, Ali Hamdi,
- Abstract要約: 本稿では,Attention-Guided AutoEncoder-Enhanced YOLOフレームワークであるAE-YOLOを提案する。
このアーキテクチャは、FPN-PAN(Feature Pyramid Network-Path Aggregation Network)のネックに軽量なボトルネックオートエンコーダを統合する。
Insulator-Defect Detectionデータセットの実験によると、効率的なNetV2バックボーンを持つAE-YOLOは0.5で95.10%のmAP、96.40%の精度、93.80%のリコールを達成した。
- 参考スコア(独自算出の注目度): 0.5097809301149341
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated defect detection in high-voltage transmission-line insulators remains challenging due to severe class imbalance, large scale variation, and the small spatial extent of defect instances in Unmanned Aerial Vehicle (UAV) imagery. To address these challenges, this paper proposes AE-YOLO, an Attention-Guided AutoEncoder-Enhanced YOLO framework for robust insulator defect detection. The architecture integrates lightweight bottleneck autoencoders within a Feature Pyramid Network-Path Aggregation Network (FPN-PAN) neck. This preserves anomaly-sensitive information during multi-scale feature fusion. Convolutional Block Attention Modules (CBAM) are used throughout the backbone, enhancing feature discrimination and suppressing background interference. The framework also introduces a variance-maximizing autoencoder regularization strategy, which encourages diverse, defect-discriminative latent representations. The network trains using a unified objective that combines focal loss, Complete IoU (CIoU) loss, and autoencoder regularization to address foreground-background imbalance and improve localization accuracy. During inference, Weighted Boxes Fusion (WBF) combines predictions from YOLOv8, YOLOv10, and YOLO11. An autoencoder-guided confidence boosting mechanism improves sensitivity to rare defect categories. Experiments on the Insulator-Defect Detection dataset show that AE-YOLO with an EfficientNetV2 backbone achieves 95.10 percent mAP at 0.5, 96.40 percent precision, and 93.80 percent recall. This performance surpasses the strongest YOLO-family baseline by 5.0 points in mAP at 0.5 and 6.7 points in recall. These results confirm the effectiveness and adaptability of the framework. The model is a practical and scalable solution for UAV-based transmission-line inspection and defect monitoring.
- Abstract(参考訳): 高電圧送電線絶縁体における欠陥の自動検出は, 高度不均衡, 大規模変動, 無人航空機(UAV)画像の空間的欠陥事例の少ないため, 依然として困難である。
これらの課題に対処するため,本論文では,頑健な絶縁体欠陥検出のためのアテンションガイド付きオートエンコーダ拡張YOLOフレームワークであるAE-YOLOを提案する。
このアーキテクチャは、FPN-PAN(Feature Pyramid Network-Path Aggregation Network)のネックに軽量なボトルネックオートエンコーダを統合する。
これは、マルチスケールのフィーチャ融合中に異常に敏感な情報を保存する。
Convolutional Block Attention Modules (CBAM) は背骨全体に使用され、特徴の識別を高め、バックグラウンド干渉を抑制する。
このフレームワークはまた、分散を最大化するオートエンコーダ正規化戦略を導入し、多様な欠陥を識別可能な潜在表現を奨励している。
ネットワークは、焦点損失、完全IoU(CIoU)損失、およびフォアグラウンド・バックグラウンドの不均衡に対処するためのオートエンコーダ正規化を組み合わせ、ローカライズ精度を向上させる統一目的を用いて訓練する。
推測中、Weighted Boxes Fusion (WBF)はYOLOv8、YOLOv10、YOLO11からの予測を組み合わせている。
自己エンコーダ誘導型信頼促進機構は、まれな欠陥カテゴリに対する感度を向上させる。
Insulator-Defect Detectionデータセットの実験によると、効率的なNetV2バックボーンを持つAE-YOLOは0.5で95.10%のmAP、96.40%の精度、93.80%のリコールを達成した。
このパフォーマンスは、最強のYOLOファミリーベースラインを0.5で5.0ポイント、リコールで6.7ポイント上回る。
これらの結果は,フレームワークの有効性と適応性を確認した。
このモデルは、UAVベースのトランスミッションラインインスペクションと欠陥監視のための実用的でスケーラブルなソリューションである。
関連論文リスト
- A novel YOLO26-MoE optimized by an LLM agent for insulator fault detection considering UAV images [2.2672499384619993]
本稿では, YOLO26検出器の高分解能分岐に, スパースミクチャー・オブ・エクササイズ(MoE)モジュールを組み込んだ新しいオブジェクト検出アーキテクチャであるYOLO26-MoEを提案する。
提案手法は, 1段階検出フレームワークの効率を保ちつつ, 微妙で多様な断層パターンに対する適応的特徴改善を可能にする。
論文 参考訳(メタデータ) (2026-05-19T09:40:05Z) - Generative Active Adaptation for Drifting and Imbalanced Network Intrusion Detection [14.728689487990836]
生成能動適応フレームワークは、モデルロバスト性を高めながらラベリング作業を最小化する。
我々は、シミュレーションIDSデータと実世界のISPデータセットの両方に基づいて、エンドツーエンドフレームワークNetGuardを評価した。
論文 参考訳(メタデータ) (2025-03-04T21:49:42Z) - YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0]
無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。
本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。
高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文 参考訳(メタデータ) (2024-10-15T16:00:01Z) - Joint Attention-Guided Feature Fusion Network for Saliency Detection of
Surface Defects [69.39099029406248]
本稿では,エンコーダ・デコーダネットワークに基づく表面欠陥検出のための共同注意誘導型特徴融合ネットワーク(JAFFNet)を提案する。
JAFFNetは、主にJAFFモジュールをデコードステージに組み込んで、低レベルと高レベルの機能を適応的に融合させる。
SD- Saliency-900, Magnetic tile, and DAGM 2007 で行った実験から,本手法が他の最先端手法と比較して有望な性能を達成できたことが示唆された。
論文 参考訳(メタデータ) (2024-02-05T08:10:16Z) - A Computer Vision Enabled damage detection model with improved YOLOv5
based on Transformer Prediction Head [0.0]
現在の最先端ディープラーニング(DL)に基づく損傷検出モデルは、複雑でノイズの多い環境では優れた特徴抽出能力を欠いていることが多い。
DenseSPH-YOLOv5は、DenseNetブロックをバックボーンに統合したリアルタイムDLベースの高性能損傷検出モデルである。
DenseSPH-YOLOv5は平均平均精度(mAP)が85.25%、F1スコアが81.18%、精度(P)が89.51%である。
論文 参考訳(メタデータ) (2023-03-07T22:53:36Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。