論文の概要: CarNet: A Lightweight and Efficient Encoder-Decoder Architecture for
High-quality Road Crack Detection
- arxiv url: http://arxiv.org/abs/2109.05707v1
- Date: Mon, 13 Sep 2021 05:01:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:36:52.792524
- Title: CarNet: A Lightweight and Efficient Encoder-Decoder Architecture for
High-quality Road Crack Detection
- Title(参考訳): CarNet: 高品質道路き裂検出のための軽量かつ効率的なエンコーダデコーダアーキテクチャ
- Authors: Kai Li, Yingjie Tian, and Zhiquan Qi
- Abstract要約: 高速かつ高品質な亀裂検出のための軽量エンコーダデコーダアーキテクチャであるCarNetを提案する。
特に、理想的なエンコーダは、異なる段階における畳み込み層数に関するオリーブ型分布を示すべきである。
デコーダでは、クラック検出のためのリッチな階層的特徴を学習するために、軽量なアップサンプリング機能ピラミッドモジュールを導入する。
- 参考スコア(独自算出の注目度): 21.468229247797627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pixel-wise crack detection is a challenging task because of poor continuity
and low contrast in cracks. The existing frameworks usually employ complex
models leading to good accuracy and yet low inference efficiency. In this
paper, we present a lightweight encoder-decoder architecture, CarNet, for
efficient and high-quality crack detection. To this end, we first propose that
the ideal encoder should present an olive-type distribution about the number of
convolutional layers at different stages. Specifically, as the network stages
deepen in the encoder, the number of convolutional layers shows a downward
trend after the model input is compressed in the initial network stage.
Meanwhile, in the decoder, we introduce a lightweight up-sampling feature
pyramid module to learn rich hierarchical features for crack detection. In
particular, we compress the feature maps of the last three network stages to
the same channels and then employ up-sampling with different multiples to
resize them to the same resolutions for information fusion. Finally, extensive
experiments on four public databases, i.e., Sun520, Rain365, BJN260, and
Crack360, demonstrate that our CarNet gains a good trade-off between inference
efficiency and test accuracy over the existing state-of-the-art methods.
- Abstract(参考訳): レンズ回りのき裂検出は、連続性が悪く、ひび割れのコントラストが低いため難しい課題である。
既存のフレームワークは通常、高い精度と低い推論効率をもたらす複雑なモデルを採用している。
本稿では,高速かつ高品質な亀裂検出のための軽量エンコーダデコーダアーキテクチャであるCarNetを提案する。
この目的のために、まず、理想エンコーダは、異なる段階における畳み込み層数に関するオリーブ型分布を提示すべきである。
具体的には、エンコーダのネットワークステージが深まるにつれて、モデル入力が初期ネットワークステージで圧縮された後、畳み込み層の数は下向きの傾向を示す。
一方、デコーダでは、クラック検出のためのリッチな階層的特徴を学習するための軽量なアップサンプリング機能ピラミッドモジュールを導入する。
特に、最後の3つのネットワークステージの機能マップを同じチャネルに圧縮し、異なる倍数でアップサンプリングして、情報融合のために同じ解像度にリサイズします。
最後に、Sun520、Rain365、BJN260、Crack360という4つのパブリックデータベースに関する広範な実験は、我々のCarNetが既存の最先端手法よりも推論効率とテスト精度の良好なトレードオフを得ることを示した。
関連論文リスト
- Extreme Encoder Output Frame Rate Reduction: Improving Computational
Latencies of Large End-to-End Models [59.57732929473519]
エンコーダに複数のフレーム削減層を適用し,少数の出力フレームにエンコーダ出力を圧縮する。
入力音声の2.56秒毎に1つのエンコーダ出力フレームを生成できることを示す。
論文 参考訳(メタデータ) (2024-02-27T03:40:44Z) - FFCA-Net: Stereo Image Compression via Fast Cascade Alignment of Side
Information [44.88123177525665]
マルチビュー圧縮技術、特にステレオ画像圧縮(SIC)は、車載カメラや3D関連アプリケーションにおいて重要な役割を果たす。
本稿では,デコーダの側情報を完全に活用する機能ベースの高速カスケードアライメントネットワーク(FFCA-Net)を提案する。
提案手法は,他の手法よりも3倍から10倍高速な復号化を実現する。
論文 参考訳(メタデータ) (2023-12-28T11:12:03Z) - NASH: A Simple Unified Framework of Structured Pruning for Accelerating
Encoder-Decoder Language Models [29.468888611690346]
本稿では、エンコーダを狭め、エンコーダ-デコーダモデルのデコーダネットワークを短縮する、シンプルで効果的なフレームワークNASHを提案する。
その結果,(1)デコーダの層数が推論速度の主要因であること,(2)プルーンドエンコーダネットワークの低間隔性が生成品質を向上させること,の2つの知見が明らかになった。
論文 参考訳(メタデータ) (2023-10-16T04:27:36Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - PlutoNet: An Efficient Polyp Segmentation Network with Modified Partial
Decoder and Decoder Consistency Training [0.40611352512781856]
PlutoNetは2,626,537のパラメータしか必要とせず、そのパラメータの10%以下である。
修正部分復号器と補助復号器を併用して訓練し、整合性を強化し、エンコーダ表現の改善に役立てる。
我々は、PlutoNetが最先端のモデルよりも優れていることを示すアブレーション研究と広範な実験を行った。
論文 参考訳(メタデータ) (2022-04-06T20:29:00Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Automatic Crack Detection on Road Pavements Using Encoder Decoder
Architecture [9.34360241512198]
提案アルゴリズムは,階層型特徴学習と拡張畳み込みを用いたエンコーダデコーダアーキテクチャ,U-階層型拡張ネットワーク (U-HDN) を提案する。
複数のコンテキスト情報を持つき裂特性は、自動的に学習し、エンドツーエンドのき裂検出を行うことができる。
論文 参考訳(メタデータ) (2020-07-01T13:32:23Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。