論文の概要: WRT-SAM: Foundation Model-Driven Segmentation for Generalized Weld Radiographic Testing
- arxiv url: http://arxiv.org/abs/2502.11338v1
- Date: Mon, 17 Feb 2025 01:31:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:10:50.003352
- Title: WRT-SAM: Foundation Model-Driven Segmentation for Generalized Weld Radiographic Testing
- Title(参考訳): WRT-SAM:一般溶接X線撮影のための基礎モデル駆動セグメンテーション
- Authors: Yunyi Zhou, Kun Shi, Gang Hao,
- Abstract要約: この研究は、一般的な溶接試験画像にSAMベースのセグメンテーションを導入した最初のものである。
WRT-SAMは,特殊なプロンプトジェネレータアーキテクチャとアダプタベースの統合によりSAMを利用する新しい溶接欠陥セグメンテーションモデルである。
WRT-SAMのリコールは78.87%、精度は84.04%、AUCは0.9746で、新しい最先端(SOTA)ベンチマークが設定されている。
- 参考スコア(独自算出の注目度): 0.8309949345495992
- License:
- Abstract: Radiographic testing is a fundamental non-destructive evaluation technique for identifying weld defects and assessing quality in industrial applications due to its high-resolution imaging capabilities. Over the past decade, deep learning techniques have significantly advanced weld defect identification in radiographic images. However, conventional approaches, which rely on training small-scale, task-specific models on single-scenario datasets, exhibit poor cross-scenario generalization. Recently, the Segment Anything Model (SAM), a pre-trained visual foundation model trained on large-scale datasets, has demonstrated exceptional zero-shot generalization capabilities. Fine-tuning SAM with limited domain-specific data has yielded promising results in fields such as medical image segmentation and anomaly detection. To the best of our knowledge, this work is the first to introduce SAM-based segmentation for general weld radiographic testing images. We propose WRT-SAM, a novel weld radiographic defect segmentation model that leverages SAM through an adapter-based integration with a specialized prompt generator architecture. To improve adaptability to grayscale weld radiographic images, we introduce a frequency prompt generator module, which enhances the model's sensitivity to frequency-domain information. Furthermore, to address the multi-scale nature of weld defects, we incorporate a multi-scale prompt generator module, enabling the model to effectively extract and encode defect information across varying scales. Extensive experimental evaluations demonstrate that WRT-SAM achieves a recall of 78.87%, a precision of 84.04%, and an AUC of 0.9746, setting a new state-of-the-art (SOTA) benchmark. Moreover, the model exhibits superior zero-shot generalization performance, highlighting its potential for practical deployment in diverse radiographic testing scenarios.
- Abstract(参考訳): 放射線透過試験は溶接欠陥の同定と高分解能イメージング機能による産業応用の品質評価のための基礎的非破壊評価技術である。
過去10年間で、深層学習技術は放射線画像における溶接欠陥の同定を著しく進歩させてきた。
しかし、単一シナリオデータセット上で、小規模でタスク固有のモデルをトレーニングすることに依存する従来のアプローチでは、クロスシナリオの一般化が不十分である。
最近、大規模データセットでトレーニングされた事前学習された視覚基盤モデルであるSegment Anything Model (SAM)は、例外的なゼロショット一般化機能を示している。
ドメイン固有データに制限のある微調整SAMは、医用画像のセグメンテーションや異常検出などの分野で有望な結果をもたらしている。
我々の知る限り、この研究は、一般的な溶接試験画像にSAMベースのセグメンテーションを導入する最初のものである。
WRT-SAM は,特殊なプロンプトジェネレータアーキテクチャとアダプタベースの統合により SAM を利用した新しい溶接欠陥分割モデルである。
グレースケール溶接画像への適応性を向上させるため,周波数領域情報に対するモデルの感度を高める周波数プロンプト生成モジュールを導入する。
さらに, 溶接欠陥のマルチスケール性に対処するため, 複数スケールのプロンプト生成モジュールを組み込むことで, 種々のスケールの欠陥情報を効果的に抽出し, エンコードすることができる。
大規模な実験的評価により、WRT-SAMは78.87%、精度84.04%、AUCは0.9746となり、新しい最先端(SOTA)ベンチマークが設定された。
さらに、このモデルはより優れたゼロショット一般化性能を示し、様々な放射線検査シナリオにおける実用的展開の可能性を強調している。
関連論文リスト
- Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors [62.63467652611788]
実画像27,600枚、223,400枚、AI拡張画像1,472,700枚を含むSEMI-TRUTHSを紹介する。
それぞれの画像には、検出器のロバスト性の標準化と目標評価のためのメタデータが添付されている。
以上の結果から,現状の検出器は摂動の種類や程度,データ分布,拡張方法に様々な感度を示すことが示唆された。
論文 参考訳(メタデータ) (2024-11-12T01:17:27Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。
我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。
我々の推論速度は拡散法よりも1,400倍速い。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Towards a vision foundation model for comprehensive assessment of Cardiac MRI [11.838157772803282]
心臓磁気共鳴画像(CMR)評価のための視覚基礎モデルを提案する。
CMRワークフローに典型的な9つの臨床的タスクについて、教師付き方法でモデルを微調整する。
すべてのタスクにおいて、ラベル付きデータセットサイズの範囲で、精度と堅牢性が改善されたことを実証する。
論文 参考訳(メタデータ) (2024-10-02T15:32:01Z) - SAM-VMNet: Deep Neural Networks For Coronary Angiography Vessel Segmentation [2.6879908098704544]
我々は,MedSAMの強力な特徴抽出機能と VM-UNet の線形複雑性の利点を組み合わせた新しいアーキテクチャ SAM-VMNet を提案する。
実験の結果、SAM-VMNetアーキテクチャはCTAイメージセグメンテーションタスクにおいて、98.32%までのセグメンテーション精度と99.33%までの感度で優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-01T16:45:33Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Performance, Successes and Limitations of Deep Learning Semantic
Segmentation of Multiple Defects in Transmission Electron Micrographs [9.237363938772479]
深層学習Mask Regional Convolutional Neural Network (Mask R-CNN)モデルを用いて, 電子顕微鏡によるFeCrAl合金の欠陥のセマンティックセグメンテーションを行う。
本稿では, 欠陥形状の予測分布, 欠陥サイズ, 欠陥同感度などの量に着目し, キーモデルの性能統計の詳細な分析を行う。
全体として、現在のモデルは、顕微鏡画像中の複数の欠陥タイプを自動解析し、定量化するための、高速で効果的なツールであることがわかった。
論文 参考訳(メタデータ) (2021-10-15T17:57:59Z) - Stain-Robust Mitotic Figure Detection for the Mitosis Domain
Generalization Challenge [2.072197863131669]
Mitosis DOmain Generalization (MIDOG)の課題は、複数のスキャナーから見えないデータに対して、検出モデルの堅牢性をテストすることである。
この課題に対処するために,TAAセンターチームが採用したアプローチについて,簡単な概要を述べる。
論文 参考訳(メタデータ) (2021-09-02T11:44:42Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - An interpretable classifier for high-resolution breast cancer screening
images utilizing weakly supervised localization [45.00998416720726]
医用画像の特徴に対処する枠組みを提案する。
このモデルはまず、画像全体の低容量だがメモリ効率のよいネットワークを使用して、最も情報性の高い領域を識別する。
次に、選択したリージョンから詳細を収集するために、別の高容量ネットワークを適用します。
最後に、グローバルおよびローカル情報を集約して最終的な予測を行うフュージョンモジュールを使用する。
論文 参考訳(メタデータ) (2020-02-13T15:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。