論文の概要: RHA-Net: An Encoder-Decoder Network with Residual Blocks and Hybrid
Attention Mechanisms for Pavement Crack Segmentation
- arxiv url: http://arxiv.org/abs/2207.14166v1
- Date: Thu, 28 Jul 2022 15:26:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-29 12:15:42.101353
- Title: RHA-Net: An Encoder-Decoder Network with Residual Blocks and Hybrid
Attention Mechanisms for Pavement Crack Segmentation
- Title(参考訳): rha-net:残留ブロックと舗装き裂分割のためのハイブリッド注意機構を備えたエンコーダ・デコーダネットワーク
- Authors: Guijie Zhu, Zhun Fan, Jiacheng Liu, Duan Yuan, Peili Ma, Meihua Wang,
Weihua Sheng, Kelvin C. P. Wang
- Abstract要約: RHA-Netは、残余ブロック(ResBlocks)とハイブリッドアテンションブロックをエンコーダ・デコーダアーキテクチャに統合することで構築される。
組込みデバイスJetson TX2(25FPS)上で,舗装クラックをリアルタイムで分割するシステムを開発した。
- 参考スコア(独自算出の注目度): 7.972704288200679
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The acquisition and evaluation of pavement surface data play an essential
role in pavement condition evaluation. In this paper, an efficient and
effective end-to-end network for automatic pavement crack segmentation, called
RHA-Net, is proposed to improve the pavement crack segmentation accuracy. The
RHA-Net is built by integrating residual blocks (ResBlocks) and hybrid
attention blocks into the encoder-decoder architecture. The ResBlocks are used
to improve the ability of RHA-Net to extract high-level abstract features. The
hybrid attention blocks are designed to fuse both low-level features and
high-level features to help the model focus on correct channels and areas of
cracks, thereby improving the feature presentation ability of RHA-Net. An image
data set containing 789 pavement crack images collected by a self-designed
mobile robot is constructed and used for training and evaluating the proposed
model. Compared with other state-of-the-art networks, the proposed model
achieves better performance and the functionalities of adding residual blocks
and hybrid attention mechanisms are validated in a comprehensive ablation
study. Additionally, a light-weighted version of the model generated by
introducing depthwise separable convolution achieves better a performance and a
much faster processing speed with 1/30 of the number of U-Net parameters. The
developed system can segment pavement crack in real-time on an embedded device
Jetson TX2 (25 FPS). The video taken in real-time experiments is released at
https://youtu.be/3XIogk0fiG4.
- Abstract(参考訳): 舗装面データの取得と評価は, 舗装条件評価に不可欠な役割を担っている。
本稿では, RHA-Net と呼ばれる自動舗装ひび割れセグメンテーションのための効率的かつ効率的なエンドツーエンドネットワークを提案し, 舗装ひび割れセグメンテーションの精度を向上する。
RHA-Netは、残余ブロック(ResBlocks)とハイブリッドアテンションブロックをエンコーダ・デコーダアーキテクチャに統合して構築されている。
ResBlocksは、RHA-Netの高レベルな抽象機能を抽出する能力を改善するために使用される。
ハイブリッドアテンションブロックは、低レベル機能と高レベル機能の両方を融合して、モデルが正しいチャネルと亀裂領域に集中できるように設計されており、RHA-Netの特徴提示能力が改善されている。
自設計の移動ロボットが収集した789枚の舗装クラック画像を含む画像データセットを構築し、提案モデルを構築し評価する。
他の最先端ネットワークと比較して,提案モデルの性能は向上し,残差ブロックの追加機能やハイブリッド注意機構は包括的アブレーション研究で検証された。
さらに、奥行き分離可能な畳み込みを導入して生成された軽量バージョンは、U-Netパラメータの1/30でより優れた性能と処理速度を実現する。
開発したシステムは、組み込みデバイスJetson TX2(25 FPS)上で、舗装クラックをリアルタイムで分割することができる。
リアルタイム実験で撮影されたビデオはhttps://youtu.be/3XIogk0fiG4で公開されている。
関連論文リスト
- Revisiting Generative Adversarial Networks for Binary Semantic
Segmentation on Imbalanced Datasets [20.538287907723713]
異常き裂領域検出は典型的なバイナリセマンティックセグメンテーションタスクであり、アルゴリズムによって舗装面画像上のひび割れを表す画素を自動的に検出することを目的としている。
既存のディープラーニングベースの手法は、特定の公共舗装のデータセットで優れた結果を得たが、不均衡なデータセットでは性能が劇的に低下する。
画素レベルの異常き裂領域検出タスクに対して,条件付き生成逆ネットワーク(cGAN)に基づくディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-03T19:24:40Z) - DANet: Enhancing Small Object Detection through an Efficient Deformable
Attention Network [0.0]
我々は,より高速なR-CNNと最先端の手法を併用した包括的戦略を提案する。
より高速なR-CNNとFeature Pyramid Networkを組み合わせることで、製造環境に固有のマルチスケール機能を扱うことができる。
変形可能なネット(Deformable Net)は、欠陥の幾何学的バリエーションを歪曲し、従って、極小および複雑な特徴を検出できる精度をもたらす。
論文 参考訳(メタデータ) (2023-10-09T14:54:37Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - Real-time High-Resolution Neural Network with Semantic Guidance for
Crack Segmentation [4.651261550392625]
本稿では,ひび割れのセグメンテーションに特化して設計されたセマンティックガイダンスを備えた高分解能ネットワークHrSegNetについて述べる。
HrSegNetは、ひび割れの詳細を保存しながらリアルタイムの推論速度を保証する。
このアプローチは、高分解能モデリングとリアルタイム検出の間にトレードオフがあることを実証する。
論文 参考訳(メタデータ) (2023-07-01T08:38:18Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - IMDeception: Grouped Information Distilling Super-Resolution Network [7.6146285961466]
SISR(Single-Image-Super-Resolution)は、ディープラーニング手法の最近の進歩の恩恵を受けている古典的なコンピュータビジョン問題である。
本稿では,機能集約のためのIICモジュールの代替として,GPRM(Global Progressive Refinement Module)を提案する。
また,1秒あたりのパラメータ数や浮動小数点演算量(FLOPS)をさらに削減するために,GIDB(Grouped Information Distilling Blocks)を提案する。
実験の結果,提案したネットワークは,パラメータ数やFLOPSが限られているにもかかわらず,最先端モデルと同等に動作していることがわかった。
論文 参考訳(メタデータ) (2022-04-25T06:43:45Z) - CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization [61.71504948770445]
本稿では,CATRO (Class-Aware Trace Ratio Optimization) を用いた新しいチャネルプルーニング手法を提案する。
CATROは、他の最先端チャネルプルーニングアルゴリズムと同等の精度で、同様のコストまたは低コストで高い精度を達成できることを示す。
CATROは、クラス認識の特性のため、様々な分類サブタスクに適応的に効率の良いネットワークを創り出すのに適している。
論文 参考訳(メタデータ) (2021-10-21T06:26:31Z) - MFGNet: Dynamic Modality-Aware Filter Generation for RGB-T Tracking [72.65494220685525]
可視データと熱データ間のメッセージ通信を促進するために,新しい動的モダリティ対応フィルタ生成モジュール(MFGNet)を提案する。
我々は、2つの独立ネットワークを持つ動的モダリティ対応フィルタを生成し、その可視フィルタとサーマルフィルタをそれぞれ、対応する入力特徴写像上で動的畳み込み演算を行う。
重閉塞,高速移動,外見による問題に対処するため,新たな方向認識型目標誘導型アテンション機構を活用することで,共同で局所的・グローバル検索を行うことを提案する。
論文 参考訳(メタデータ) (2021-07-22T03:10:51Z) - Efficient Spatio-Temporal Recurrent Neural Network for Video Deblurring [39.63844562890704]
リアルタイムの劣化は、空間的および時間的に変化するぼやけ自体の複雑さのため、依然として困難な課題である。
我々はRNN細胞に残留密度ブロックを適用して、現在のフレームの空間的特徴を効率的に抽出する。
我々は、コ軸ビームスプリッタ取得システムを用いて、ペア/シャープのビデオクリップを収集し、新しいデータセット(BSD)をコミュニティにコントリビュートする。
論文 参考訳(メタデータ) (2021-06-30T12:53:02Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。