Fugu-MT 論文翻訳(概要): Multi-Scale Feature Fusion: Learning Better Semantic Segmentation for Road Pothole Detection

論文の概要: Multi-Scale Feature Fusion: Learning Better Semantic Segmentation for Road Pothole Detection

arxiv url: http://arxiv.org/abs/2112.13082v1
Date: Fri, 24 Dec 2021 15:07:47 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-28 13:57:33.919047
Title: Multi-Scale Feature Fusion: Learning Better Semantic Segmentation for Road Pothole Detection
Title（参考訳）: マルチスケール機能融合:道路ポットホール検出のためのセマンティックセグメンテーションの学習
Authors: Jiahe Fan, Mohammud J. Bocus, Brett Hosking, Rigen Wu, Yanan Liu, Sergey Vityazev, Rui Fan
Abstract要約: 本稿では,単一モーダルなセマンティックセグメンテーションに基づく新しいポットホール検出手法を提案する。まず、畳み込みニューラルネットワークを用いて入力画像から視覚的特徴を抽出する。チャネルアテンションモジュールは、異なるフィーチャーマップの一貫性を高めるために、チャネル機能を再考する。
参考スコア（独自算出の注目度）: 9.356003255288417
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper presents a novel pothole detection approach based on single-modal semantic segmentation. It first extracts visual features from input images using a convolutional neural network. A channel attention module then reweighs the channel features to enhance the consistency of different feature maps. Subsequently, we employ an atrous spatial pyramid pooling module (comprising of atrous convolutions in series, with progressive rates of dilation) to integrate the spatial context information. This helps better distinguish between potholes and undamaged road areas. Finally, the feature maps in the adjacent layers are fused using our proposed multi-scale feature fusion module. This further reduces the semantic gap between different feature channel layers. Extensive experiments were carried out on the Pothole-600 dataset to demonstrate the effectiveness of our proposed method. The quantitative comparisons suggest that our method achieves the state-of-the-art (SoTA) performance on both RGB images and transformed disparity images, outperforming three SoTA single-modal semantic segmentation networks.
Abstract（参考訳）: 本稿では,単一モーダル意味セグメンテーションに基づく新しいポットホール検出手法を提案する。まず、畳み込みニューラルネットワークを用いて入力画像から視覚的特徴を抽出する。チャネルアテンションモジュールは、異なる機能マップの一貫性を高めるためにチャネル機能を強化します。次に,空間的コンテキスト情報を統合するために,アトーラス空間ピラミッドプーリングモジュール(連続的なアトーラス畳み込みと拡張率)を用いる。これにより、ポットホールと無傷道路の区別が容易になる。最後に, 提案したマルチスケール機能融合モジュールを用いて, 隣接層内の特徴マップを融合する。これにより、異なる機能チャネル層間のセマンティクスギャップはさらに低減される。提案手法の有効性を実証するため,Pothole-600データセットを用いて実験を行った。定量的比較により,本手法はRGB画像と変換された異種画像の両方において最先端(SoTA)性能を実現し,STA単一モーダルセマンティックセマンティックセマンティクスネットワークを3つ上回った。

関連論文リスト

DIFF-MF: A Difference-Driven Channel-Spatial State Space Model for Multi-Modal Image Fusion [51.07069814578009]
マルチモーダル画像融合は、複数のソース画像から補完的な情報を統合して、リッチなコンテンツで高品質な融合画像を生成することを目的としている。マルチモーダル画像融合のための差動駆動型チャネル空間空間モデルDIFF-MFを提案する。本手法は,視覚的品質と定量的評価の両方において,既存の手法よりも優れている。
論文参考訳（メタデータ） (2026-01-09T05:26:54Z)
SMLNet: A SPD Manifold Learning Network for Infrared and Visible Image Fusion [60.18614468818683]
マルチモーダル画像融合のための新しいSPD(対称正定値)多様体学習を提案する。我々のフレームワークは現在の最先端手法と比較して優れた性能を示す。
論文参考訳（メタデータ） (2024-11-16T03:09:49Z)
DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。 MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-12-11T18:38:28Z)
Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。 5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文参考訳（メタデータ） (2023-08-24T03:50:37Z)
Semantic Labeling of High Resolution Images Using EfficientUNets and Transformers [5.177947445379688]
畳み込みニューラルネットワークとディープトランスを組み合わせた新しいセグメンテーションモデルを提案する。提案手法は,最先端技術と比較してセグメント化精度が向上することを示す。
論文参考訳（メタデータ） (2022-06-20T12:03:54Z)
FPS-Net: A Convolutional Fusion Network for Large-Scale LiDAR Point Cloud Segmentation [30.736361776703568]
LiDARポイントクラウドに基づくシーン理解は、自動運転車が安全に運転するのに不可欠なタスクです。既存のほとんどのメソッドは、情報容量を増やすために、画像チャネルとして異なるポイント属性/モダリティを積み重ねる。 fps-netは,最適なポイントクラウドセグメンテーションのために,投影画像チャネル間の一意性と不一致を生かす畳み込み型融合ネットワークである。
論文参考訳（メタデータ） (2021-03-01T04:08:28Z)
Bidirectional Multi-scale Attention Networks for Semantic Segmentation of Oblique UAV Imagery [30.524771772192757]
本稿では、より適応的で効果的な特徴抽出のために、複数スケールの特徴を双方向に融合する新しい双方向多スケールアテンションネットワークを提案する。当モデルでは,平均和合(mIoU)スコア70.80%でSOTA(State-of-the-art)を達成した。
論文参考訳（メタデータ） (2021-02-05T11:02:15Z)
Dual Attention GANs for Semantic Image Synthesis [101.36015877815537]
本稿では,写真リアリスティック・セマンティック・一貫性のあるイメージを合成するための新しいデュアルアテンションGAN(DAGAN)を提案する。また,2つの新しいモジュール,すなわち位置対応空間アテンションモジュール(SAM)と規模対応チャネルアテンションモジュール(CAM)を提案する。 DAGANは、より少ないモデルパラメータを使用しながら、最先端のメソッドよりも驚くほど優れた結果が得られる。
論文参考訳（メタデータ） (2020-08-29T17:49:01Z)
Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文参考訳（メタデータ） (2020-08-25T06:00:06Z)
Deep Convolutional Neural Network for Identifying Seam-Carving Forgery [10.324492319976798]
本稿では,畳み込み型ニューラルネットワーク(CNN)を用いたシーム彫刻に基づく画像の分類と拡大手法を提案する。本研究は,3クラス分類(オリジナル,シーム挿入,シーム除去)における最先端性能を示す。
論文参考訳（メタデータ） (2020-07-05T17:20:51Z)
Adaptive feature recombination and recalibration for semantic segmentation with Fully Convolutional Networks [57.64866581615309]
完全畳み込みネットワークを用いたセマンティックセグメンテーションに適応した特徴の組換えと空間適応型再分類ブロックを提案する。その結果、再結合と再校正は競争ベースラインの結果を改善し、3つの異なる問題にまたがって一般化することを示した。
論文参考訳（メタデータ） (2020-06-19T15:45:03Z)
Attentive CutMix: An Enhanced Data Augmentation Approach for Deep Learning Based Image Classification [58.20132466198622]
そこで我々は,CutMixに基づく自然拡張拡張戦略であるAttentive CutMixを提案する。各トレーニングイテレーションにおいて、特徴抽出器から中間注意マップに基づいて最も記述性の高い領域を選択する。提案手法は単純かつ有効であり,実装が容易であり,ベースラインを大幅に向上させることができる。
論文参考訳（メタデータ） (2020-03-29T15:01:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。