論文の概要: Multi-Modal Attention Networks for Enhanced Segmentation and Depth Estimation of Subsurface Defects in Pulse Thermography
- arxiv url: http://arxiv.org/abs/2501.09994v1
- Date: Fri, 17 Jan 2025 07:24:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-20 14:00:18.173176
- Title: Multi-Modal Attention Networks for Enhanced Segmentation and Depth Estimation of Subsurface Defects in Pulse Thermography
- Title(参考訳): パルスサーモグラフィーにおけるセグメンテーションの強化と地下欠陥の深さ推定のためのマルチモーダルアテンションネットワーク
- Authors: Mohammed Salah, Naoufel Werghi, Davor Svetinovic, Yusra Abdulrahman,
- Abstract要約: 非破壊検査(NDT)におけるAI駆動型パルスサーモグラフィ(PT)の重要性
主成分分析(PCA)またはサーモグラフィ信号再構成(TSR)を用いてPTシーケンスを圧縮したセグメント分割と深さ推定ネットワークの現況技術
本研究は,PCAとTSRを融合したマルチモーダルアテンションベース核融合ネットワークPT-Fusionを提案する。
- 参考スコア(独自算出の注目度): 5.718538232143911
- License:
- Abstract: AI-driven pulse thermography (PT) has become a crucial tool in non-destructive testing (NDT), enabling automatic detection of hidden anomalies in various industrial components. Current state-of-the-art techniques feed segmentation and depth estimation networks compressed PT sequences using either Principal Component Analysis (PCA) or Thermographic Signal Reconstruction (TSR). However, treating these two modalities independently constrains the performance of PT inspection models as these representations possess complementary semantic features. To address this limitation, this work proposes PT-Fusion, a multi-modal attention-based fusion network that fuses both PCA and TSR modalities for defect segmentation and depth estimation of subsurface defects in PT setups. PT-Fusion introduces novel feature fusion modules, Encoder Attention Fusion Gate (EAFG) and Attention Enhanced Decoding Block (AEDB), to fuse PCA and TSR features for enhanced segmentation and depth estimation of subsurface defects. In addition, a novel data augmentation technique is proposed based on random data sampling from thermographic sequences to alleviate the scarcity of PT datasets. The proposed method is benchmarked against state-of-the-art PT inspection models, including U-Net, attention U-Net, and 3D-CNN on the Universit\'e Laval IRT-PVC dataset. The results demonstrate that PT-Fusion outperforms the aforementioned models in defect segmentation and depth estimation accuracies with a margin of 10%.
- Abstract(参考訳): AI駆動型パルスサーモグラフィ(PT)は非破壊検査(NDT)において重要なツールとなり、各種産業部品の隠れた異常の自動検出を可能にしている。
現在の最先端技術は、主成分分析(PCA)またはサーモグラフィ信号再構成(TSR)を用いてPTシーケンスを圧縮したセグメンテーションと深さ推定ネットワークを提供する。
しかし、これらの2つのモダリティを個別に扱うことはPT検査モデルの性能を制約し、これらの表現は相補的な意味的特徴を持つ。
この制限に対処するために、PT-Fusionというマルチモーダルアテンションベースのフュージョンネットワークを提案し、PCAとTSRの両モードを融合させ、PTセットアップにおける欠陥分割とサブサーフェス欠陥の深さ推定を行う。
PT-Fusion は新たな機能融合モジュール Encoder Attention Fusion Gate (EAFG) と Attention Enhanced Decoding Block (AEDB) を導入し、PCA と TSR の機能を融合させ、地下欠陥のセグメンテーションと深さ推定を行う。
さらに、PTデータセットの不足を軽減するために、サーモグラフィーシーケンスからのランダムなデータサンプリングに基づいて、新しいデータ拡張手法を提案する。
提案手法は,Universit\'e Laval IRT-PVCデータセット上で,U-Net,注目U-Net,3D-CNNを含む最先端のPT検査モデルに対してベンチマークを行う。
その結果, PT-Fusionは, 欠陥セグメント化および深さ推定精度において, 10%のマージンで上述したモデルより優れていた。
関連論文リスト
- YOLO-pdd: A Novel Multi-scale PCB Defect Detection Method Using Deep Representations with Sequential Images [7.368447690189973]
本稿では,CNNに基づくPCB欠陥検出のための高精度で堅牢でリアルタイムなエンドツーエンド手法を提案する。
本稿では, YOLOv5とマルチスケールモジュールを組み合わせた階層的残差接続手法を提案する。
大規模PCBデータセットの実験では、既存の手法と比較して精度、リコール、F1スコアが大幅に改善された。
論文 参考訳(メタデータ) (2024-07-22T07:08:22Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - SEMI-DiffusionInst: A Diffusion Model Based Approach for Semiconductor
Defect Classification and Segmentation [0.11999555634662631]
この研究は拡散モデルを用いて半導体欠陥パターンを正確に検出し、正確にセグメント化する最初の実演である。
提案手法は,mAP全体のこれまでの成果よりも優れており,ほぼすべての欠陥クラスに対して比較的優れた性能を示す。
論文 参考訳(メタデータ) (2023-07-17T17:53:36Z) - Non-contact Sensing for Anomaly Detection in Wind Turbine Blades: A
focus-SVDD with Complex-Valued Auto-Encoder Approach [2.967390112155113]
我々は、FMCWレーダを非破壊検知モードとして利用する製造の品質保証を強化する。
焦点支援ベクトルデータ記述(focus-SVDD)と呼ばれる新しい異常検出手法を提案する。
提案手法の有効性は, 収集データへの適用を通して実証する。
論文 参考訳(メタデータ) (2023-06-19T09:54:34Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。
我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-03-21T17:59:50Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Defect segmentation: Mapping tunnel lining internal defects with ground
penetrating radar data using a convolutional neural network [13.469645178974638]
本研究では, トンネル内部欠陥の非破壊検出のための地中貫入レーダ(GPR)データ処理手法を提案する。
この手法では、内部欠陥構造をGPR合成データにマッピングするために、Segnetと呼ばれるCNNとLov'aszソフトマックス損失関数を組み合わせる。
論文 参考訳(メタデータ) (2020-03-29T19:30:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。