論文の概要: A Multitask Deep Learning Model for Parsing Bridge Elements and
Segmenting Defect in Bridge Inspection Images
- arxiv url: http://arxiv.org/abs/2209.02190v1
- Date: Tue, 6 Sep 2022 02:48:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:15:59.802409
- Title: A Multitask Deep Learning Model for Parsing Bridge Elements and
Segmenting Defect in Bridge Inspection Images
- Title(参考訳): 橋梁要素解析のためのマルチタスク深層学習モデルと橋梁検査画像におけるセグメント欠陥
- Authors: Chenyu Zhang, Muhammad Monjurul Karim, Ruwen Qin
- Abstract要約: 合衆国の広大な橋網は、その維持と修復に高い要求を課している。
橋の状況を評価するための視覚検査の膨大なコストは、ある程度の負担であることが判明した。
本稿では,橋梁要素と欠陥の相互依存性を完全に活用するマルチタスクディープニューラルネットワークを開発する。
- 参考スコア(独自算出の注目度): 1.476043573732074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The vast network of bridges in the United States raises a high requirement
for its maintenance and rehabilitation. The massive cost of manual visual
inspection to assess the conditions of the bridges turns out to be a burden to
some extent. Advanced robots have been leveraged to automate inspection data
collection. Automating the segmentations of multiclass elements, as well as
surface defects on the elements, in the large volume of inspection image data
would facilitate an efficient and effective assessment of the bridge condition.
Training separate single-task networks for element parsing (i.e., semantic
segmentation of multiclass elements) and defect segmentation fails to
incorporate the close connection between these two tasks in the inspection
images where both recognizable structural elements and apparent surface defects
are present. This paper is motivated to develop a multitask deep neural network
that fully utilizes such interdependence between bridge elements and defects to
boost the performance and generalization of the model. Furthermore, the
effectiveness of the proposed network designs in improving the task performance
was investigated, including feature decomposition, cross-talk sharing, and
multi-objective loss function. A dataset with pixel-level labels of bridge
elements and corrosion was developed for training and assessment of the models.
Quantitative and qualitative results from evaluating the developed multitask
deep neural network demonstrate that the recommended network outperforms the
independent single-task networks not only in performance (2.59% higher mIoU on
bridge parsing and 1.65% on corrosion segmentation) but also in computational
time and implementation capability.
- Abstract(参考訳): アメリカ合衆国における広大な橋のネットワークは、その維持とリハビリへの高い要求を高めている。
橋の状況を評価するための手作業による視覚検査の膨大なコストは、ある程度の負担となっている。
高度なロボットは検査データ収集を自動化するために活用されている。
多種元素のセグメンテーションの自動化、および多数の検査画像データにおける要素の表面欠陥の自動化は、橋梁条件の効率的かつ効果的な評価を容易にする。
要素解析と欠陥セグメンテーションのための個別の単一タスクネットワークのトレーニングは、これらの2つのタスク間の密接な接続を、認識可能な構造要素と表面欠陥の両方が存在する検査画像に組み込むことができない。
本稿では,橋梁要素と欠陥間の相互依存を十分に活用し,モデルの性能と一般化を促進するマルチタスク深層ニューラルネットワークの開発を動機とする。
さらに,特徴分解,クロストーク共有,多目的損失関数などのタスク性能向上のためのネットワーク設計の有効性について検討した。
橋梁要素と腐食の画素レベルラベル付きデータセットを開発し, モデルの訓練と評価を行った。
開発したマルチタスクディープニューラルネットワークの評価による定量的および定性的な結果から、推奨されたネットワークは独立したシングルタスクネットワークよりも性能が高い(橋梁解析では2.59%、腐食セグメンテーションでは1.65%)。
関連論文リスト
- Multi-task Feature Enhancement Network for No-Reference Image Quality Assessment [4.4150617622399055]
マルチタスク戦略に基づくNo-Reference Image Quality Assessment (NR-IQA)手法はいくつかの課題に直面する。
本フレームワークは,高周波抽出ネットワーク,品質推定ネットワーク,歪み認識ネットワークの3つの主要コンポーネントから構成される。
5つの標準IQAデータベースによる実験結果から,本手法が高い性能を達成し,堅牢な一般化能力を示すことが確認された。
論文 参考訳(メタデータ) (2024-11-12T05:10:32Z) - Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - FriendNet: Detection-Friendly Dehazing Network [24.372610892854283]
本稿では,イメージデハジングとオブジェクト検出を,ガイダンス情報とタスク駆動学習によってブリッジする効果的なアーキテクチャを提案する。
FriendNetは、高品質な認識と高い検出能力の両方を提供することを目指している。
論文 参考訳(メタデータ) (2024-03-07T12:19:04Z) - BridgeNet: Comprehensive and Effective Feature Interactions via Bridge Feature for Multi-task Dense Predictions [29.049866510120093]
マルチタスク密度予測は,複数の画素単位の予測タスクを統合ネットワーク内で同時に処理し,視覚的シーン理解を実現することを目的としている。
これらの未探索問題に対処するために,包括的かつ識別的な中間ブリッジ特徴を抽出する新しいブリッジネットフレームワークを提案する。
私たちの知る限りでは、クロスタスクインタラクションにおける機能参加者の完全性と品質を考慮した最初の作品です。
論文 参考訳(メタデータ) (2023-12-21T01:30:44Z) - A Deep Neural Network for Multiclass Bridge Element Parsing in
Inspection Image Analysis [9.635496805334899]
本稿では,検査画像における多クラスブリッジ要素のパースに適したディープニューラルネットワーク(DNN)を決定することを目的とする。
データ拡張と130の画像のトレーニングサンプルにより、事前訓練されたHRNetは、構造要素解析のタスクに効率的に転送される。
論文 参考訳(メタデータ) (2022-09-05T21:02:08Z) - A semi-supervised self-training method to develop assistive intelligence
for segmenting multiclass bridge elements from inspection videos [6.75013674088437]
本稿では,検査ビデオから多クラス橋要素をセグメント化するための補助情報モデルを開発する。
大規模な公開データセットで事前トレーニングされたマスクリージョンベースの畳み込みニューラルネットワーク(Mask R-CNN)が新しいタスクに転送された。
半教師付き自己訓練(S$3$T)法が開発され、経験豊富な検査官がネットワークを精査する。
論文 参考訳(メタデータ) (2021-09-10T19:22:45Z) - Tasks Integrated Networks: Joint Detection and Retrieval for Image
Search [99.49021025124405]
多くの現実世界の探索シナリオ(例えばビデオ監視)では、オブジェクトは正確に検出または注釈付けされることはめったにない。
まず、エンド・ツー・エンド統合ネット(I-Net)を紹介します。
さらに,2つの新しいコントリビューションを行うDC-I-Netという改良されたI-Netを提案する。
論文 参考訳(メタデータ) (2020-09-03T03:57:50Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Reparameterizing Convolutions for Incremental Multi-Task Learning
without Task Interference [75.95287293847697]
マルチタスクモデルを開発する際の2つの一般的な課題は、しばしば文献で見過ごされる。
まず、モデルを本質的に漸進的に可能にし、以前に学んだことを忘れずに新しいタスクから情報を継続的に取り入れる(インクリメンタルラーニング)。
第二に、タスク間の有害な相互作用を排除し、マルチタスク設定(タスク干渉)においてシングルタスクのパフォーマンスを著しく低下させることが示されている。
論文 参考訳(メタデータ) (2020-07-24T14:44:46Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。