論文の概要: Kernel Inversed Pyramidal Resizing Network for Efficient Pavement
Distress Recognition
- arxiv url: http://arxiv.org/abs/2212.01790v1
- Date: Sun, 4 Dec 2022 10:40:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 15:37:37.577518
- Title: Kernel Inversed Pyramidal Resizing Network for Efficient Pavement
Distress Recognition
- Title(参考訳): 効率的な舗装難易度認識のためのカーネル逆ピラミッドリサイズネットワーク
- Authors: Rong Qin and Luwen Huangfu and Devon Hood and James Ma and Sheng Huang
- Abstract要約: 画像リサイズのために,Kernel Inversed Pyramidal Resizing Network (KIPRN) というライトネットワークを導入した。
KIPRNでは、ピラミッドの畳み込みとカーネルの逆転畳み込みは、識別情報をマイニングするために特別に設計されている。
以上の結果から,KIPRNは一般的にCNNモデルの舗装救難認識を改善することが示唆された。
- 参考スコア(独自算出の注目度): 9.927965682734069
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pavement Distress Recognition (PDR) is an important step in pavement
inspection and can be powered by image-based automation to expedite the process
and reduce labor costs. Pavement images are often in high-resolution with a low
ratio of distressed to non-distressed areas. Advanced approaches leverage these
properties via dividing images into patches and explore discriminative features
in the scale space. However, these approaches usually suffer from information
loss during image resizing and low efficiency due to complex learning
frameworks. In this paper, we propose a novel and efficient method for PDR. A
light network named the Kernel Inversed Pyramidal Resizing Network (KIPRN) is
introduced for image resizing, and can be flexibly plugged into the image
classification network as a pre-network to exploit resolution and scale
information. In KIPRN, pyramidal convolution and kernel inversed convolution
are specifically designed to mine discriminative information across different
feature granularities and scales. The mined information is passed along to the
resized images to yield an informative image pyramid to assist the image
classification network for PDR. We applied our method to three well-known
Convolutional Neural Networks (CNNs), and conducted an evaluation on a
large-scale pavement image dataset named CQU-BPDD. Extensive results
demonstrate that KIPRN can generally improve the pavement distress recognition
of these CNN models and show that the simple combination of KIPRN and
EfficientNet-B3 significantly outperforms the state-of-the-art patch-based
method in both performance and efficiency.
- Abstract(参考訳): 舗装難易度認識(pdr)は舗装検査の重要なステップであり、画像ベースの自動化によってプロセスを迅速化し、労働コストを削減することができる。
舗装画像は、しばしば高分解能で、非抵抗領域に対する苦難の割合が低い。
高度なアプローチでは、イメージをパッチに分割することでこれらの特性を活用し、スケールスペースにおける識別的特徴を探求する。
しかしながら、これらのアプローチは通常、画像リサイズ時の情報損失と複雑な学習フレームワークによる低効率に悩まされる。
本稿では,PDRの新規かつ効率的な手法を提案する。
画像再サイズのために、kernel inversed pyramidal resizing network(kiprn)という光ネットワークが導入され、解像度とスケール情報を利用するためのプリネットワークとして画像分類ネットワークに柔軟に接続することができる。
KIPRNでは、ピラミッドの畳み込みとカーネルの逆転畳み込みは、異なる特徴の粒度とスケールで識別情報をマイニングするように設計されている。
マイニングされた情報をリサイズ画像に渡して情報的画像ピラミッドを生成し、PDRの画像分類ネットワークを支援する。
提案手法を3つの有名な畳み込みニューラルネットワーク(CNN)に適用し,CQU-BPDDと呼ばれる大規模舗装画像データセットの評価を行った。
その結果、KIPRNは一般的にこれらのCNNモデルの舗装苦難認識を改善し、KIPRNとEfficientNet-B3の単純な組み合わせは、パフォーマンスと効率の両面で最先端のパッチベースの手法よりも大幅に優れていることを示した。
関連論文リスト
- AMSA-UNet: An Asymmetric Multiple Scales U-net Based on Self-attention for Deblurring [7.00986132499006]
asymmetric multiple scales U-net based on self-attention (AMSA-UNet) was proposed to improve the accuracy and compute complexity。
マルチスケールなU字型アーキテクチャを導入することで、ネットワークはグローバルレベルでぼやけた領域に集中でき、ローカルレベルで画像の詳細を回復することができる。
論文 参考訳(メタデータ) (2024-06-13T11:39:02Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - EPNet: An Efficient Pyramid Network for Enhanced Single-Image
Super-Resolution with Reduced Computational Requirements [12.439807086123983]
シングルイメージ超解像(SISR)は、ディープラーニングの統合によって大幅に進歩した。
本稿では,エッジ分割ピラミッドモジュール (ESPM) とパノラマ特徴抽出モジュール (PFEM) を調和して結合し,既存の手法の限界を克服する,EPNet (Efficient Pyramid Network) を提案する。
論文 参考訳(メタデータ) (2023-12-20T19:56:53Z) - PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded
Diffraction Patterns Phase Retrieval [6.982256124089]
位相検索は、計算画像および画像処理における非線型逆問題である。
我々は,1次反復しきい値しきい値アルゴリズム(ISTA)に基づく深層展開ネットワークであるPRISTA-Netを開発した。
非線形変換,しきい値,ステップサイズなど,提案するPRISTA-Netフレームワークのパラメータはすべて,設定されるのではなく,エンドツーエンドで学習される。
論文 参考訳(メタデータ) (2023-09-08T07:37:15Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Deep Triplet Hashing Network for Case-based Medical Image Retrieval [33.21919320742157]
我々は、低次元のハッシュコードを学ぶために、Attention-based Triplet Hashing (ATH) ネットワークと呼ばれるエンドツーエンドのフレームワークを提案する。
提案したATHは,最先端のディープハッシュ法と比較して,検索性能を向上できることを示す。
論文 参考訳(メタデータ) (2021-01-29T01:35:46Z) - FDRN: A Fast Deformable Registration Network for Medical Images [3.3504365823045044]
本稿では,高速な畳み込みニューラルネットワークを提案する。
FDRNは、コンパクトなネットワーク構造と効率的な学習により、既存の脳MR画像の最先端登録方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-04T14:09:51Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。