論文の概要: Graph Attention Layer Evolves Semantic Segmentation for Road Pothole
Detection: A Benchmark and Algorithms
- arxiv url: http://arxiv.org/abs/2109.02711v1
- Date: Mon, 6 Sep 2021 19:44:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-08 14:53:38.074608
- Title: Graph Attention Layer Evolves Semantic Segmentation for Road Pothole
Detection: A Benchmark and Algorithms
- Title(参考訳): 道路電位検出のためのセマンティックセグメンテーションを伴うグラフ注意層:ベンチマークとアルゴリズム
- Authors: Rui Fan, Hengli Wang, Yuan Wang, Ming Liu, Ioannis Pitas
- Abstract要約: 既存の道路穴検出アプローチは、コンピュータビジョンベースまたは機械学習ベースに分類される。
後者のアプローチは一般的に、畳み込みニューラルネットワーク(CNN)をエンドツーエンドに使用した道路孔検出に対処する。
本稿では,既存の任意のCNNに容易に展開可能で,画像特徴表現をセマンティックセグメンテーションに最適化できる新しいCNN層を提案する。
- 参考スコア(独自算出の注目度): 34.80667966432126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing road pothole detection approaches can be classified as computer
vision-based or machine learning-based. The former approaches typically employ
2-D image analysis/understanding or 3-D point cloud modeling and segmentation
algorithms to detect road potholes from vision sensor data. The latter
approaches generally address road pothole detection using convolutional neural
networks (CNNs) in an end-to-end manner. However, road potholes are not
necessarily ubiquitous and it is challenging to prepare a large well-annotated
dataset for CNN training. In this regard, while computer vision-based methods
were the mainstream research trend in the past decade, machine learning-based
methods were merely discussed. Recently, we published the first stereo
vision-based road pothole detection dataset and a novel disparity
transformation algorithm, whereby the damaged and undamaged road areas can be
highly distinguished. However, there are no benchmarks currently available for
state-of-the-art (SoTA) CNNs trained using either disparity images or
transformed disparity images. Therefore, in this paper, we first discuss the
SoTA CNNs designed for semantic segmentation and evaluate their performance for
road pothole detection with extensive experiments. Additionally, inspired by
graph neural network (GNN), we propose a novel CNN layer, referred to as graph
attention layer (GAL), which can be easily deployed in any existing CNN to
optimize image feature representations for semantic segmentation. Our
experiments compare GAL-DeepLabv3+, our best-performing implementation, with
nine SoTA CNNs on three modalities of training data: RGB images, disparity
images, and transformed disparity images. The experimental results suggest that
our proposed GAL-DeepLabv3+ achieves the best overall pothole detection
accuracy on all training data modalities.
- Abstract(参考訳): 既存の道路穴検出アプローチは、コンピュータビジョンベースまたは機械学習ベースに分類される。
従来のアプローチでは、視覚センサデータから道路の穴を検出するために、2次元画像解析/理解または3次元ポイントクラウドモデリングとセグメンテーションアルゴリズムが使用される。
後者のアプローチは一般に畳み込みニューラルネットワーク(cnns)を用いた道路ポットホール検出をエンドツーエンドで扱う。
しかし,道路の穴は必ずしもユビキタスではないため,CNNトレーニングのための大規模な注釈付きデータセットの作成は困難である。
この点において、コンピュータビジョンに基づく手法が過去10年間の主流の研究トレンドであったのに対し、機械学習に基づく手法は単に議論されただけである。
近年,損傷や損傷のない道路エリアを高度に区別できる,立体視による道路穴検出データセットと,新しい異質度変換アルゴリズムを公表した。
しかし、現状(SoTA)のCNNには現在、異質な画像または変換異質な画像を使用してトレーニングされたベンチマークはない。
そこで本稿では,まずセマンティックセグメンテーション用に設計されたSoTA CNNについて論じ,その性能を広範囲な実験により評価する。
さらに,グラフニューラルネットワーク(GNN)にインスパイアされた新しいCNN層を提案する。グラフアテンション層(GAL)は,既存のCNNに容易に展開でき,セマンティックセグメンテーションのための画像特徴表現を最適化することができる。
GAL-DeepLabv3+と、RGB画像、不均質画像、変換異質画像という3つのトレーニングデータに対する9つのSoTA CNNを比較した。
実験の結果,提案したGAL-DeepLabv3+は,全てのトレーニングデータに対して,最高のポットホール検出精度を実現することが示唆された。
関連論文リスト
- Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - A Novel Hand Gesture Detection and Recognition system based on
ensemble-based Convolutional Neural Network [3.5665681694253903]
コンピュータビジョンとパターン認識コミュニティでは,手の部分検出が課題となっている。
畳み込みニューラルネットワーク(CNN)アーキテクチャのようなディープラーニングアルゴリズムは、分類タスクにおいて非常に一般的な選択肢となっている。
本稿では,CNNに基づくアプローチのアンサンブルを用いて,予測時の高分散や過度な問題,予測誤差などの問題を克服する。
論文 参考訳(メタデータ) (2022-02-25T06:46:58Z) - Segmentation of Roads in Satellite Images using specially modified U-Net
CNNs [0.0]
本研究の目的は,道路画像の特定を行う都市景観の衛星画像の分類器を構築することである。
従来のコンピュータビジョンアルゴリズムとは異なり、畳み込みニューラルネットワーク(CNN)はこのタスクに対して正確で信頼性の高い結果を提供する。
論文 参考訳(メタデータ) (2021-09-29T19:08:32Z) - OSLO: On-the-Sphere Learning for Omnidirectional images and its
application to 360-degree image compression [59.58879331876508]
全方向画像の表現モデルの学習について検討し、全方向画像の深層学習モデルで使用される数学的ツールを再定義するために、HEALPixの球面一様サンプリングの特性を利用することを提案する。
提案したオン・ザ・スフィア・ソリューションは、等方形画像に適用された類似の学習モデルと比較して、13.7%のビットレートを節約できる圧縮ゲインを向上させる。
論文 参考訳(メタデータ) (2021-07-19T22:14:30Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Learning Collision-Free Space Detection from Stereo Images: Homography
Matrix Brings Better Data Augmentation [16.99302954185652]
少数のトレーニングサンプルを使用して、深い畳み込みニューラルネットワーク(DCNN)を訓練することは、依然としてオープンな課題です。
本稿では,dcnnの性能向上に有効なトレーニングデータ拡張手法について検討する。
論文 参考訳(メタデータ) (2020-12-14T19:14:35Z) - Towards Dense People Detection with Deep Learning and Depth images [9.376814409561726]
本稿では,1つの深度画像から複数の人物を検出するDNNシステムを提案する。
我々のニューラルネットワークは深度画像を処理し、画像座標の確率マップを出力する。
我々は、この戦略が効果的であることを示し、トレーニング中に使用するものと異なるシーンで動作するように一般化したネットワークを創出する。
論文 参考訳(メタデータ) (2020-07-14T16:43:02Z) - DiResNet: Direction-aware Residual Network for Road Extraction in VHR
Remote Sensing Images [12.081877372552606]
主に3つのコントリビューションを含む方向対応残差ネットワーク(DiResNet)を提案する。
提案手法は総合精度とF1スコアの両方に利点がある。
論文 参考訳(メタデータ) (2020-05-14T19:33:21Z) - Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance
Disparity Estimation [51.17232267143098]
ステレオ画像から3次元物体を検出するための新しいシステムDisp R-CNNを提案する。
我々は、LiDAR点雲を必要とせずに、統計的形状モデルを用いて、密度の異なる擬似地下構造を生成する。
KITTIデータセットの実験によると、LiDARの基盤構造がトレーニング時に利用できない場合でも、Disp R-CNNは競争性能を達成し、平均精度で従来の最先端手法を20%上回っている。
論文 参考訳(メタデータ) (2020-04-07T17:48:45Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。