Fugu-MT 論文翻訳(概要): RHA-Net: An Encoder-Decoder Network with Residual Blocks and Hybrid Attention Mechanisms for Pavement Crack Segmentation

論文の概要: RHA-Net: An Encoder-Decoder Network with Residual Blocks and Hybrid Attention Mechanisms for Pavement Crack Segmentation

arxiv url: http://arxiv.org/abs/2207.14166v1
Date: Thu, 28 Jul 2022 15:26:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-29 12:15:42.101353
Title: RHA-Net: An Encoder-Decoder Network with Residual Blocks and Hybrid Attention Mechanisms for Pavement Crack Segmentation
Title（参考訳）: rha-net:残留ブロックと舗装き裂分割のためのハイブリッド注意機構を備えたエンコーダ・デコーダネットワーク
Authors: Guijie Zhu, Zhun Fan, Jiacheng Liu, Duan Yuan, Peili Ma, Meihua Wang, Weihua Sheng, Kelvin C. P. Wang
Abstract要約: RHA-Netは、残余ブロック(ResBlocks)とハイブリッドアテンションブロックをエンコーダ・デコーダアーキテクチャに統合することで構築される。組込みデバイスJetson TX2(25FPS)上で,舗装クラックをリアルタイムで分割するシステムを開発した。
参考スコア（独自算出の注目度）: 7.972704288200679
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The acquisition and evaluation of pavement surface data play an essential role in pavement condition evaluation. In this paper, an efficient and effective end-to-end network for automatic pavement crack segmentation, called RHA-Net, is proposed to improve the pavement crack segmentation accuracy. The RHA-Net is built by integrating residual blocks (ResBlocks) and hybrid attention blocks into the encoder-decoder architecture. The ResBlocks are used to improve the ability of RHA-Net to extract high-level abstract features. The hybrid attention blocks are designed to fuse both low-level features and high-level features to help the model focus on correct channels and areas of cracks, thereby improving the feature presentation ability of RHA-Net. An image data set containing 789 pavement crack images collected by a self-designed mobile robot is constructed and used for training and evaluating the proposed model. Compared with other state-of-the-art networks, the proposed model achieves better performance and the functionalities of adding residual blocks and hybrid attention mechanisms are validated in a comprehensive ablation study. Additionally, a light-weighted version of the model generated by introducing depthwise separable convolution achieves better a performance and a much faster processing speed with 1/30 of the number of U-Net parameters. The developed system can segment pavement crack in real-time on an embedded device Jetson TX2 (25 FPS). The video taken in real-time experiments is released at https://youtu.be/3XIogk0fiG4.
Abstract（参考訳）: 舗装面データの取得と評価は, 舗装条件評価に不可欠な役割を担っている。本稿では, RHA-Net と呼ばれる自動舗装ひび割れセグメンテーションのための効率的かつ効率的なエンドツーエンドネットワークを提案し, 舗装ひび割れセグメンテーションの精度を向上する。 RHA-Netは、残余ブロック(ResBlocks)とハイブリッドアテンションブロックをエンコーダ・デコーダアーキテクチャに統合して構築されている。 ResBlocksは、RHA-Netの高レベルな抽象機能を抽出する能力を改善するために使用される。ハイブリッドアテンションブロックは、低レベル機能と高レベル機能の両方を融合して、モデルが正しいチャネルと亀裂領域に集中できるように設計されており、RHA-Netの特徴提示能力が改善されている。自設計の移動ロボットが収集した789枚の舗装クラック画像を含む画像データセットを構築し、提案モデルを構築し評価する。他の最先端ネットワークと比較して,提案モデルの性能は向上し,残差ブロックの追加機能やハイブリッド注意機構は包括的アブレーション研究で検証された。さらに、奥行き分離可能な畳み込みを導入して生成された軽量バージョンは、U-Netパラメータの1/30でより優れた性能と処理速度を実現する。開発したシステムは、組み込みデバイスJetson TX2(25 FPS)上で、舗装クラックをリアルタイムで分割することができる。リアルタイム実験で撮影されたビデオはhttps://youtu.be/3XIogk0fiG4で公開されている。

関連論文リスト

Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文参考訳（メタデータ） (2025-04-19T09:54:46Z)
Low-Level Matters: An Efficient Hybrid Architecture for Robust Multi-frame Infrared Small Target Detection [5.048364655933007]
マルチフレーム赤外線小目標検出は、低高度および海洋監視において重要な役割を果たす。 CNNとTransformerを組み合わせたハイブリッドアーキテクチャは、マルチフレームIRSTDの強化に大いに期待できる。低レベルの機能学習ハイブリッドフレームワークを再定義する,シンプルながら強力なハイブリッドアーキテクチャであるLVNetを提案する。
論文参考訳（メタデータ） (2025-03-04T02:53:25Z)
Context-CrackNet: A Context-Aware Framework for Precise Segmentation of Tiny Cracks in Pavement images [3.9599054392856483]
本研究では、RFEM(Rerea-Focused Enhancement Module)とCAGM(Context-Aware Global Module)を備えた新しいエンコーダデコーダアーキテクチャであるContext-CrackNetを提案する。このモデルは9つの最先端セグメンテーションフレームワークを一貫して上回り、mIoUやDiceスコアといった優れたパフォーマンス指標を達成した。このモデルの精度と計算効率のバランスは、大規模舗装監視システムにおけるリアルタイム展開の可能性を強調している。
論文参考訳（メタデータ） (2025-01-24T11:28:17Z)
Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-29T19:02:54Z)
Hybrid-Segmentor: A Hybrid Approach to Automated Fine-Grained Crack Segmentation in Civil Infrastructure [52.2025114590481]
エンコーダ・デコーダをベースとした手法であるHybrid-Segmentorを導入する。これにより、モデルは、様々な種類の形状、表面、き裂の大きさを区別する一般化能力を向上させることができる。提案モデルは,5つの測定基準(精度0.971,精度0.804,リコール0.744,F1スコア0.770,IoUスコア0.630)で既存ベンチマークモデルより優れ,最先端の状態を達成している。
論文参考訳（メタデータ） (2024-09-04T16:47:16Z)
Any Image Restoration with Efficient Automatic Degradation Adaptation [132.81912195537433]
本研究は, 各種劣化の相似性を有効かつ包括的修復に活用し, 共同埋設を実現する統一的な方法を提案する。我々のネットワークは、モデルの複雑さをトレーニング可能なパラメータで約82%、FLOPで約85%削減しつつ、新しいSOTAレコードを設定している。
論文参考訳（メタデータ） (2024-07-18T10:26:53Z)
HMANet: Hybrid Multi-Axis Aggregation Network for Image Super-Resolution [6.7341750484636975]
トランスフォーマーベースのネットワークは、限られた空間範囲からの入力情報しか利用できない。本稿では,Hybrid Multi-Axis Aggregation Network (HMA)を提案する。実験の結果,HMAはベンチマークデータセットの最先端手法よりも優れていた。
論文参考訳（メタデータ） (2024-05-08T12:14:34Z)
TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文参考訳（メタデータ） (2024-04-15T06:01:48Z)
Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文参考訳（メタデータ） (2024-03-15T07:18:43Z)
DANet: Enhancing Small Object Detection through an Efficient Deformable Attention Network [0.0]
我々は,より高速なR-CNNと最先端の手法を併用した包括的戦略を提案する。より高速なR-CNNとFeature Pyramid Networkを組み合わせることで、製造環境に固有のマルチスケール機能を扱うことができる。変形可能なネット(Deformable Net)は、欠陥の幾何学的バリエーションを歪曲し、従って、極小および複雑な特徴を検出できる精度をもたらす。
論文参考訳（メタデータ） (2023-10-09T14:54:37Z)
Real-time High-Resolution Neural Network with Semantic Guidance for Crack Segmentation [4.651261550392625]
本稿では,ひび割れのセグメンテーションに特化して設計されたセマンティックガイダンスを備えた高分解能ネットワークHrSegNetについて述べる。 HrSegNetは、ひび割れの詳細を保存しながらリアルタイムの推論速度を保証する。このアプローチは、高分解能モデリングとリアルタイム検出の間にトレードオフがあることを実証する。
論文参考訳（メタデータ） (2023-07-01T08:38:18Z)
CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization [61.71504948770445]
本稿では,CATRO (Class-Aware Trace Ratio Optimization) を用いた新しいチャネルプルーニング手法を提案する。 CATROは、他の最先端チャネルプルーニングアルゴリズムと同等の精度で、同様のコストまたは低コストで高い精度を達成できることを示す。 CATROは、クラス認識の特性のため、様々な分類サブタスクに適応的に効率の良いネットワークを創り出すのに適している。
論文参考訳（メタデータ） (2021-10-21T06:26:31Z)
Efficient Spatio-Temporal Recurrent Neural Network for Video Deblurring [39.63844562890704]
リアルタイムの劣化は、空間的および時間的に変化するぼやけ自体の複雑さのため、依然として困難な課題である。我々はRNN細胞に残留密度ブロックを適用して、現在のフレームの空間的特徴を効率的に抽出する。我々は、コ軸ビームスプリッタ取得システムを用いて、ペア/シャープのビデオクリップを収集し、新しいデータセット(BSD)をコミュニティにコントリビュートする。
論文参考訳（メタデータ） (2021-06-30T12:53:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。