論文の概要: Attention-Enhanced Prototypical Learning for Few-Shot Infrastructure Defect Segmentation
- arxiv url: http://arxiv.org/abs/2510.05266v1
- Date: Mon, 06 Oct 2025 18:33:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:07.939634
- Title: Attention-Enhanced Prototypical Learning for Few-Shot Infrastructure Defect Segmentation
- Title(参考訳): Few-Shot Infrastructure Defect Segmentationのための注意力強化型プロトタイプ学習
- Authors: Christina Thrainer, Md Meftahul Ferdaus, Mahdi Abdelguerfi, Christian Guetl, Steven Sloan, Kendall N. Niles, Ken Pathak,
- Abstract要約: ディープラーニングベースのインフラストラクチャ検査アプリケーションには,セマンティックセマンティックセマンティクスが不可欠だ。
提案する拡張特徴ピラミッドネットワーク(E-FPN)フレームワークは,変圧器および下水道の欠陥カテゴリのセマンティックセマンティックセマンティックセグメンテーションのためのものである。
我々のフレームワークは、新しいトレーニングデータに制限のあるインフラ検査システムにおいて、新しい欠陥タイプに迅速に対応する必要性に対処する。
- 参考スコア(独自算出の注目度): 1.440641607825089
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot semantic segmentation is vital for deep learning-based infrastructure inspection applications, where labeled training examples are scarce and expensive. Although existing deep learning frameworks perform well, the need for extensive labeled datasets and the inability to learn new defect categories with little data are problematic. We present our Enhanced Feature Pyramid Network (E-FPN) framework for few-shot semantic segmentation of culvert and sewer defect categories using a prototypical learning framework. Our approach has three main contributions: (1) adaptive E-FPN encoder using InceptionSepConv blocks and depth-wise separable convolutions for efficient multi-scale feature extraction; (2) prototypical learning with masked average pooling for powerful prototype generation from small support examples; and (3) attention-based feature representation through global self-attention, local self-attention and cross-attention. Comprehensive experimentation on challenging infrastructure inspection datasets illustrates that the method achieves excellent few-shot performance, with the best configuration being 8-way 5-shot training configuration at 82.55% F1-score and 72.26% mIoU in 2-way classification testing. The self-attention method had the most significant performance improvements, providing 2.57% F1-score and 2.9% mIoU gain over baselines. Our framework addresses the critical need to rapidly respond to new defect types in infrastructure inspection systems with limited new training data that lead to more efficient and economical maintenance plans for critical infrastructure systems.
- Abstract(参考訳): ラベル付きトレーニング例が不足し,コストがかかる,ディープラーニングベースのインフラストラクチャ検査アプリケーションには,セマンティックセマンティックセマンティクスが不可欠だ。
既存のディープラーニングフレームワークはうまく機能するが、ラベル付きデータセットの必要性と、ほとんどデータなしで新しい欠陥カテゴリを学習できないことが問題となっている。
本稿では, 原型学習フレームワークを用いて, 直交型および下水道型欠陥分類のための拡張特徴ピラミッドネットワーク(E-FPN)フレームワークを提案する。
InceptionSepConvブロックを用いた適応型E-FPNエンコーダと,効率的なマルチスケール特徴抽出のための奥行き分離可能な畳み込み,(2)小さなサポート例から,強力なプロトタイプ生成のためのマスク付き平均プールを用いたプロトタイプ学習,(3)グローバルな自己注意,局所的な自己意識,相互注意による注意に基づく特徴表現,の3つの主な貢献がある。
インフラ検査データセットに関する総合的な実験は、この手法が優れた数ショットのパフォーマンスを達成し、最良の構成は82.55%のF1スコアと72.26%のmIoUで8ウェイ5ショットのトレーニング設定であることを示している。
自己保持方式は、2.57%のF1スコアと2.9%のmIoUがベースラインを超えて向上した。
我々のフレームワークは、インフラ検査システムの欠陥タイプに迅速に対応し、重要なインフラシステムのより効率的で経済的メンテナンス計画につながるような、限られた新しいトレーニングデータで迅速に対応する必要性に対処する。
関連論文リスト
- Rethinking Pulmonary Embolism Segmentation: A Study of Current Approaches and Challenges with an Open Weight Model [21.024556007374684]
3Dモデルは、塞栓の形態的特徴から、この課題に特に適している。
CNNベースのモデルは一般的に、PEセグメンテーションにおけるVTベースのモデルよりも優れたパフォーマンスが得られる。
一方、タスクの複雑さと高品質なデータセットの不足のため、遠位塞栓は難しいままである。
論文 参考訳(メタデータ) (2025-09-22T18:34:30Z) - Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - Efficient Building Roof Type Classification: A Domain-Specific Self-Supervised Approach [2.3020018305241337]
本稿では,建築屋根型分類における自己教師型学習の有効性について検討する。
本稿では,CBAM(Convolutional Block Attention Module)を組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-28T09:04:11Z) - Crack Detection in Infrastructure Using Transfer Learning, Spatial Attention, and Genetic Algorithm Optimization [3.1687473999848836]
亀裂検出は、道路、橋、建物などのインフラの維持と安全性において重要な役割を担っている。
伝統的に手動検査が標準であったが、労働集約的で主観的で危険である。
本稿では, 深層学習, 移動学習, 空間的注意機構, 遺伝的アルゴリズム(GA)最適化を活用した, インフラのひび割れ検出のための高度な手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T06:12:56Z) - Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。
これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。
提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文 参考訳(メタデータ) (2024-09-04T16:47:16Z) - Improving Few-Shot Generalization by Exploring and Exploiting Auxiliary
Data [100.33096338195723]
補助データを用いたFew-shot Learning(FLAD)に焦点を当てる。
FLADは、一般化を改善するために、数ショットの学習中に補助データへのアクセスを前提としている。
提案するアルゴリズムは EXP3-FLAD と UCB1-FLAD の2つである。
論文 参考訳(メタデータ) (2023-02-01T18:59:36Z) - Sylph: A Hypernetwork Framework for Incremental Few-shot Object
Detection [8.492340530784697]
大量のデータを含む多くの基本カテゴリがメタトレーニングに利用できる場合、ファネチューンフリーのiFSDは極めて有効であることを示す。
我々はCOCOとLVISの両方でモデルをベンチマークし、LVISの長テールレアクラスで最大17%のAPを報告した。
論文 参考訳(メタデータ) (2022-03-25T20:39:00Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。