論文の概要: Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues
- arxiv url: http://arxiv.org/abs/2603.10549v1
- Date: Wed, 11 Mar 2026 08:58:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.859816
- Title: Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues
- Title(参考訳): 視覚情報を用いた能動赤外線サーモグラフィにおける認知的欠陥解析に向けて
- Authors: Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman,
- Abstract要約: AIRTと視覚言語モデル(VLM)を用いたCFRPにおける認知欠陥解析のための新しい言語誘導フレームワークを提案する。
従来の学習ベースアプローチとは異なり、提案フレームワークは欠陥検出装置を広範囲に訓練するためのトレーニングデータセットの開発を必要としない。
提案システムでは, サーモグラフィパターンの生成ゼロショット理解と地下欠陥の自動検出が可能となる。
- 参考スコア(独自算出の注目度): 4.186239052492289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active infrared thermography (AIRT) is currently witnessing a surge of artificial intelligence (AI) methodologies being deployed for automated subsurface defect analysis of high performance carbon fiber-reinforced polymers (CFRP). Deploying AI-based AIRT methodologies for inspecting CFRPs requires the creation of time consuming and expensive datasets of CFRP inspection sequences to train neural networks. To address this challenge, this work introduces a novel language-guided framework for cognitive defect analysis in CFRPs using AIRT and vision-language models (VLMs). Unlike conventional learning-based approaches, the proposed framework does not require developing training datasets for extensive training of defect detectors, instead it relies solely on pretrained multimodal VLM encoders coupled with a lightweight adapter to enable generative zero-shot understanding and localization of subsurface defects. By leveraging pretrained multimodal encoders, the proposed system enables generative zero-shot understanding of thermographic patterns and automatic detection of subsurface defects. Given the domain gap between thermographic data and natural images used to train VLMs, an AIRT-VLM Adapter is proposed to enhance the visibility of defects while aligning the thermographic domain with the learned representations of VLMs. The proposed framework is validated using three representative VLMs; specifically, GroundingDINO, Qwen-VL-Chat, and CogVLM. Validation is performed on 25 CFRP inspection sequences with impacts introduced at different energy levels, reflecting realistic defects encountered in industrial scenarios. Experimental results demonstrate that the AIRT-VLM adapter achieves signal-to-noise ratio (SNR) gains exceeding 10 dB compared with conventional thermographic dimensionality-reduction methods, while enabling zero-shot defect detection with intersection-over-union values reaching 70%.
- Abstract(参考訳): 能動赤外線サーモグラフィー(AIRT)は現在、高性能炭素繊維強化ポリマー(CFRP)の自動表面欠陥解析のための人工知能(AI)手法の急増を目撃している。
CFRPを検査するためにAIベースのAIRT方法論をデプロイするには、ニューラルネットワークをトレーニングするために、CFRP検査シーケンスの時間を要する高価なデータセットを作成する必要がある。
この課題に対処するため,本研究では, AIRT と視覚言語モデル (VLM) を用いた CFRP における認知欠陥解析のための新しい言語誘導フレームワークを提案する。
従来の学習ベースアプローチとは異なり、提案フレームワークは欠陥検出装置の広範囲な訓練のためのトレーニングデータセットの開発を必要とせず、より軽量なアダプタと組み合わされた事前訓練されたマルチモーダルVLMエンコーダにのみ依存し、生成ゼロショット理解と地下欠陥の局所化を可能にする。
事前学習したマルチモーダルエンコーダを利用することで,熱画像パターンのゼロショット理解と地下欠陥の自動検出が可能となる。
熱画像データとVLMの訓練に使用される自然画像との領域ギャップを考慮し, 熱画像領域とVLMの学習表現を整合させて欠陥の視認性を高めるために, AIRT-VLMアダプタを提案する。
提案手法は,3つの代表的なVLM,具体的には GroundingDINO, Qwen-VL-Chat, CogVLM を用いて検証した。
産業シナリオで遭遇した現実的な欠陥を反映した25個のCFRP検査シーケンスで、異なるエネルギーレベルでの衝撃による検証が行われる。
実験結果から,AIRT-VLMアダプタは従来手法に比べて10dBを超える信号対雑音比(SNR)のゲインを達成し,交叉対ユニオン値が70%に達するゼロショット欠陥検出を可能にした。
関連論文リスト
- Application Research of a Deep Learning Model Integrating CycleGAN and YOLO in PCB Infrared Defect Detection [7.407155043542133]
本稿では,CycleGANとYOLOv8を統合したクロスモーダルデータ拡張フレームワークを提案する。
我々は、CycleGANを利用して未ペア画像から画像への変換を行い、豊富な可視光PCB画像を赤外線領域にマッピングする。
我々は、生成した擬似赤外線データを限られた実赤外サンプルで融合させて、軽量なYOLOv8検出器を訓練する異種トレーニング戦略を構築した。
論文 参考訳(メタデータ) (2026-01-01T07:01:47Z) - Fault Cause Identification across Manufacturing Lines through Ontology-Guided and Process-Aware FMEA Graph Learning with LLMs [1.9563024477582351]
本研究では,製造領域の概念化とグラフニューラルネットワーク(GNN)推論を組み合わせることにより,FMEA再利用性を高めるプロセス認識フレームワークを提案する。
自動車用圧力センサ組立ラインのケーススタディでは,提案手法が最先端の検索強化生成(RAG)ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2025-10-17T08:35:47Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Zero-sample surface defect detection and classification based on
semantic feedback neural network [13.796631421521765]
本論文では,複数角度からの画像タグ埋め込みにおける予測誤差を適応的に低減するアンサンブル協調学習アルゴリズムを提案する。
産業分野におけるゼロショットデータセットとシリンダーライナーデータセットを用いた各種実験により,競争結果が得られた。
論文 参考訳(メタデータ) (2021-06-15T08:26:36Z) - Automatic Visual Inspection of Rare Defects: A Framework based on
GP-WGAN and Enhanced Faster R-CNN [0.0]
本稿では,自動視覚検査(AVI)システムの2段階故障診断フレームワークを提案する。
第1段階では、実サンプルに基づいて新しいサンプルを合成する生成モデルが設計されている。
提案アルゴリズムは,実際のサンプルからオブジェクトを抽出し,ランダムにブレンドし,新しいサンプルを生成し,画像処理の性能を向上させる。
論文 参考訳(メタデータ) (2021-05-02T11:34:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。