論文の概要: A semi-supervised self-training method to develop assistive intelligence
for segmenting multiclass bridge elements from inspection videos
- arxiv url: http://arxiv.org/abs/2109.05078v2
- Date: Tue, 14 Sep 2021 01:16:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-18 21:59:12.548693
- Title: A semi-supervised self-training method to develop assistive intelligence
for segmenting multiclass bridge elements from inspection videos
- Title(参考訳): 検査映像からの多層橋梁要素の分断支援のための半教師付き自己学習法
- Authors: Muhammad Monjurul Karim, Ruwen Qin, Zhaozheng Yin, Genda Chen
- Abstract要約: 本稿では,検査ビデオから多クラス橋要素をセグメント化するための補助情報モデルを開発する。
大規模な公開データセットで事前トレーニングされたマスクリージョンベースの畳み込みニューラルネットワーク(Mask R-CNN)が新しいタスクに転送された。
半教師付き自己訓練(S$3$T)法が開発され、経験豊富な検査官がネットワークを精査する。
- 参考スコア(独自算出の注目度): 6.75013674088437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bridge inspection is an important step in preserving and rehabilitating
transportation infrastructure for extending their service lives. The
advancement of mobile robotic technology allows the rapid collection of a large
amount of inspection video data. However, the data are mainly images of complex
scenes, wherein a bridge of various structural elements mix with a cluttered
background. Assisting bridge inspectors in extracting structural elements of
bridges from the big complex video data, and sorting them out by classes, will
prepare inspectors for the element-wise inspection to determine the condition
of bridges. This paper is motivated to develop an assistive intelligence model
for segmenting multiclass bridge elements from inspection videos captured by an
aerial inspection platform. With a small initial training dataset labeled by
inspectors, a Mask Region-based Convolutional Neural Network (Mask R-CNN)
pre-trained on a large public dataset was transferred to the new task of
multiclass bridge element segmentation. Besides, the temporal coherence
analysis attempts to recover false negatives and identify the weakness that the
neural network can learn to improve. Furthermore, a semi-supervised
self-training (S$^3$T) method was developed to engage experienced inspectors in
refining the network iteratively. Quantitative and qualitative results from
evaluating the developed deep neural network demonstrate that the proposed
method can utilize a small amount of time and guidance from experienced
inspectors (3.58 hours for labeling 66 images) to build the network of
excellent performance (91.8% precision, 93.6% recall, and 92.7% f1-score).
Importantly, the paper illustrates an approach to leveraging the domain
knowledge and experiences of bridge professionals into computational
intelligence models to efficiently adapt the models to varied bridges in the
National Bridge Inventory.
- Abstract(参考訳): 橋梁検査は, 交通インフラの維持と整備において, サービス寿命を延ばすための重要なステップである。
移動ロボット技術の進歩により、大量の検査ビデオデータの迅速な収集が可能となった。
しかし、データは主に複雑なシーンのイメージであり、様々な構造要素の橋梁が散らばった背景と混ざり合っている。
複雑な映像データから橋梁の構造要素を抽出し、クラス別にソートするブリッジインスペクタを支援することで、橋梁の状態を決定するための要素インスペクタを作成する。
本稿では,空中検査プラットフォームで撮影した検査ビデオから,多層橋梁要素の分断を支援する支援インテリジェンスモデルを開発することを目的としている。
インスペクタによってラベル付けされた小さな初期トレーニングデータセットにより、大きなパブリックデータセットで事前トレーニングされたマスク領域ベースの畳み込みニューラルネットワーク(mask r-cnn)が、マルチクラスブリッジ要素セグメンテーションの新しいタスクに転送された。
さらに、時間的コヒーレンス分析は、偽陰性を回復し、ニューラルネットワークが改善するために学べる弱点を特定しようとする。
さらに,ネットワークを反復的に精査する経験者を対象に,半教師付き自己訓練法(S$^3$T)を開発した。
開発した深層ニューラルネットワークの評価から得られた定量的・定性的な結果は、経験豊富な検査官(66画像のラベル付けに3.58時間)による少量の時間とガイダンスを用いて、優れた性能(91.8%の精度、93.6%のリコール、92.7%のf1-score)のネットワークを構築することができることを示している。
重要なことに、本論文は、橋梁専門家のドメイン知識と経験を計算知モデルに活用し、橋梁インベントリのさまざまな橋に効率的に適用するためのアプローチを示す。
関連論文リスト
- Instance Segmentation of Reinforced Concrete Bridges with Synthetic Point Clouds [0.0]
ナショナルブリッジ検査基準は、詳細な要素レベルの橋の検査を必要とする。
伝統的に、検査官は損傷に基づく構造的要素の評価によって手動で評価を割り当てる。
3つの異なる手法を用いて合成データを生成する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T18:28:41Z) - BridgeData V2: A Dataset for Robot Learning at Scale [73.86688388408021]
BridgeData V2は、ロボット操作行動の大規模で多様なデータセットである。
対象は、24の環境にまたがる60,096個のトラジェクトリだ。
論文 参考訳(メタデータ) (2023-08-24T17:41:20Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - A Multitask Deep Learning Model for Parsing Bridge Elements and
Segmenting Defect in Bridge Inspection Images [1.476043573732074]
合衆国の広大な橋網は、その維持と修復に高い要求を課している。
橋の状況を評価するための視覚検査の膨大なコストは、ある程度の負担であることが判明した。
本稿では,橋梁要素と欠陥の相互依存性を完全に活用するマルチタスクディープニューラルネットワークを開発する。
論文 参考訳(メタデータ) (2022-09-06T02:48:15Z) - A Deep Neural Network for Multiclass Bridge Element Parsing in
Inspection Image Analysis [9.635496805334899]
本稿では,検査画像における多クラスブリッジ要素のパースに適したディープニューラルネットワーク(DNN)を決定することを目的とする。
データ拡張と130の画像のトレーニングサンプルにより、事前訓練されたHRNetは、構造要素解析のタスクに効率的に転送される。
論文 参考訳(メタデータ) (2022-09-05T21:02:08Z) - Proper Reuse of Image Classification Features Improves Object Detection [4.240984948137734]
トランスファーラーニングの一般的な実践は、データに基づく上流タスクで事前学習することで、下流モデルの重み付けを初期化することである。
近年の研究では、長いトレーニング体制下では必須ではないことが示されており、背骨をスクラッチからトレーニングするためのレシピを提供している。
知識保存の極端な形態 -- 分類器dのバックボーンを凍結する -- が、一貫して多くの異なる検出モデルを改善していることを示す。
論文 参考訳(メタデータ) (2022-04-01T14:44:47Z) - HierMUD: Hierarchical Multi-task Unsupervised Domain Adaptation between
Bridges for Drive-by Damage Diagnosis [9.261126434781744]
対象橋のラベルを使わずに,橋梁の損傷を診断するために,ある橋梁から学習したモデルを転送する新しい枠組みを提案する。
我々のフレームワークは、タスク共有とタスク固有の特徴を抽出するために、逆方向の方法で階層型ニューラルネットワークモデルを訓練する。
2つの橋と3台の車両から収集した実験データについて,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2021-07-23T19:39:32Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - TubeTK: Adopting Tubes to Track Multi-Object in a One-Step Training
Model [51.14840210957289]
マルチオブジェクトトラッキングは、長い間研究されてきた基本的な視覚問題である。
Tracking by Detection (TBD)の成功にもかかわらず、この2段階の手法はエンドツーエンドでトレーニングするには複雑すぎる。
本稿では,短いビデオクリップ中の物体の時間空間位置を示すために,バウンディングチューブを導入することで,一段階のトレーニングしか必要としない簡潔なエンドツーエンドモデルチューブTKを提案する。
論文 参考訳(メタデータ) (2020-06-10T06:45:05Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。