論文の概要: No-Service Rail Surface Defect Segmentation via Normalized Attention and
Dual-scale Interaction
- arxiv url: http://arxiv.org/abs/2306.15442v1
- Date: Tue, 27 Jun 2023 12:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-28 13:20:41.654513
- Title: No-Service Rail Surface Defect Segmentation via Normalized Attention and
Dual-scale Interaction
- Title(参考訳): ノーマライズドアテンションとデュアルスケールインタラクションによる非サービスレール表面欠陥セグメンテーション
- Authors: Gongyang Li and Chengjun Han and Zhi Liu
- Abstract要約: ノーサービスレール表面欠陥(NRSD)セグメンテーションは、ノーサービスレールの品質を知覚するための重要な方法である。
既存の自然画像分割法はNRSD画像において有望な性能を達成できない。
そこで我々は, NaDiNet という名前の正規化注意とデュアルスケールインタラクションに基づく NRSD のための新しいセグメンテーションネットワークを提案する。
- 参考スコア(独自算出の注目度): 13.150295919228013
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: No-service rail surface defect (NRSD) segmentation is an essential way for
perceiving the quality of no-service rails. However, due to the complex and
diverse outlines and low-contrast textures of no-service rails, existing
natural image segmentation methods cannot achieve promising performance in NRSD
images, especially in some unique and challenging NRSD scenes. To this end, in
this paper, we propose a novel segmentation network for NRSDs based on
Normalized Attention and Dual-scale Interaction, named NaDiNet. Specifically,
NaDiNet follows the enhancement-interaction paradigm. The Normalized
Channel-wise Self-Attention Module (NAM) and the Dual-scale Interaction Block
(DIB) are two key components of NaDiNet. NAM is a specific extension of the
channel-wise self-attention mechanism (CAM) to enhance features extracted from
low-contrast NRSD images. The softmax layer in CAM will produce very small
correlation coefficients which are not conducive to low-contrast feature
enhancement. Instead, in NAM, we directly calculate the normalized correlation
coefficient between channels to enlarge the feature differentiation. DIB is
specifically designed for the feature interaction of the enhanced features. It
has two interaction branches with dual scales, one for fine-grained clues and
the other for coarse-grained clues. With both branches working together, DIB
can perceive defect regions of different granularities. With these modules
working together, our NaDiNet can generate accurate segmentation map. Extensive
experiments on the public NRSD-MN dataset with man-made and natural NRSDs
demonstrate that our proposed NaDiNet with various backbones (i.e., VGG,
ResNet, and DenseNet) consistently outperforms 10 state-of-the-art methods. The
code and results of our method are available at
https://github.com/monxxcn/NaDiNet.
- Abstract(参考訳): ノーサービスレール表面欠陥(NRSD)セグメンテーションは、ノーサービスレールの品質を知覚するための重要な方法である。
しかし,非サービスレールの複雑で多彩なアウトラインと低コントラストテクスチャのため,既存の自然画像分割法はNRSD画像,特に独特で困難なNRSDシーンにおいて有望な性能を達成できない。
そこで本稿では,正規化注意とデュアルスケールインタラクションに基づくNRSDのための新しいセグメンテーションネットワークNaDiNetを提案する。
具体的には、NaDiNetは拡張-相互作用パラダイムに従う。
正規化チャネルワイドセルフアテンションモジュール(NAM)とデュアルスケールインタラクションブロック(DIB)は、NaDiNetの2つの重要なコンポーネントである。
NAMは、低コントラストNRSD画像から抽出した特徴を高めるために、チャネルワイド自己保持機構(CAM)の特定の拡張である。
CAMのソフトマックス層は、低コントラスト特性向上に寄与しない非常に小さな相関係数を生成する。
その代わり、namではチャネル間の正規化相関係数を直接計算し、特徴分化を拡大する。
DIBは、拡張された機能のフィーチャインタラクションのために特別に設計されている。
双対のスケールを持つ2つの相互作用枝があり、1つは細かな手掛かり、もう1つは粗い手掛かりである。
両方のブランチが連携することで、dibは異なる粒度の欠陥領域を知覚することができる。
これらのモジュールが連携することで、NaDiNetは正確なセグメンテーションマップを生成することができます。
人為的および自然的NRSDを用いた公開NRSD-MNデータセットの広範な実験により,提案したNaDiNetのバックボーン(VGG,ResNet,DenseNet)は,常に10の最先端の手法より優れていることが示された。
このメソッドのコードと結果は、https://github.com/monxxcn/nadinet.comで入手できる。
関連論文リスト
- Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - NICE: Improving Panoptic Narrative Detection and Segmentation with
Cascading Collaborative Learning [77.95710025273218]
我々は2つの単視的物語認識タスクを共同で学習できるNICEという統合フレームワークを提案する。
PNSとPNDを連接してセグメンテーションのバリ中心をアンカーとすることで、我々のアプローチは2つのタスクを自然に整列させる。
NICEは既存のすべての手法を大差で上回り、PNDは4.1%、PNSは2.9%となっている。
論文 参考訳(メタデータ) (2023-10-17T03:42:12Z) - Multi-Dimensional Refinement Graph Convolutional Network with Robust
Decouple Loss for Fine-Grained Skeleton-Based Action Recognition [19.031036881780107]
本稿では,CVSTA(Channel-Variable Space-Temporal Attention)と呼ばれるフレキシブルアテンションブロックを提案する。
CVSTAに基づくMDR-GCN(Multi-dimensional Refinement Graph Convolutional Network)を構築し,チャネルレベル,ジョイントレベル,フレームレベルの特徴の識別を改善する。
さらに,CVSTAの効果を著しく向上し,騒音の影響を低減させるロバスト・デデュプル・ロス(RDL)を提案する。
論文 参考訳(メタデータ) (2023-06-27T09:23:36Z) - Towards Stable Co-saliency Detection and Object Co-segmentation [12.979401244603661]
本稿では,CoSODとCoSEGを同時検出する新しいモデルを提案する。
まず、ダミーオーダー機構(DOM)とリカレントユニット(RU)を含むマルチパス安定リカレントユニット(MSRU)を提案する。
提案したMSRUは、CoSOD(CoSEG)モデルが堅牢な画像間関係をキャプチャするだけでなく、秩序感を低減し、より安定した推論とトレーニングプロセスを実現する。
論文 参考訳(メタデータ) (2022-09-25T03:58:49Z) - Neural Implicit Dictionary via Mixture-of-Expert Training [111.08941206369508]
ニューラルインシシット辞書(NID)を学習することで、データとトレーニング効率の両方を達成する汎用INRフレームワークを提案する。
我々のNIDは、所望の関数空間にまたがるように調整された座標ベースのImpworksのグループを組み立てる。
実験の結果,NIDは最大98%の入力データで2次元画像や3次元シーンの再現を2桁高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-08T05:07:19Z) - MSO: Multi-Feature Space Joint Optimization Network for RGB-Infrared
Person Re-Identification [35.97494894205023]
RGB-infrared cross-modality person re-identification (ReID) タスクは、可視モダリティと赤外線モダリティの同一性の画像を認識することを目的としている。
既存の手法は主に2ストリームアーキテクチャを使用して、最終的な共通特徴空間における2つのモード間の相違を取り除く。
単一モダリティ空間と共通空間の両方において、モダリティ調和可能な特徴を学習できる新しい多機能空間共同最適化(MSO)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-21T16:45:23Z) - RSI-Net: Two-Stream Deep Neural Network Integrating GCN and Atrous CNN
for Semantic Segmentation of High-resolution Remote Sensing Images [3.468780866037609]
本稿では,リモートセンシング画像(RSI-Net)のセマンティックセグメンテーションのための2ストリームディープニューラルネットワークを提案する。
実験はVayhingen、Potsdam、Gaofen RSIデータセットで実施されている。
その結果,6つの最先端RSIセマンティックセグメンテーション法と比較して,総合的精度,F1スコア,カッパ係数において,RSI-Netの優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-19T15:57:20Z) - CM-NAS: Cross-Modality Neural Architecture Search for Visible-Infrared
Person Re-Identification [102.89434996930387]
VI-ReIDは、暗い環境での単一モダリティ人物ReIDの制限を突破し、クロスモダリティ歩行者のイメージを一致させることを目指しています。
既存の作品は、さまざまな2ストリームアーキテクチャを手動で設計して、モダリティ固有およびモダリティシャーブル表現を別々に学習する。
CM-NAS(Cross-Modality Neural Architecture Search)という手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T07:07:00Z) - Accurate and Lightweight Image Super-Resolution with Model-Guided Deep
Unfolding Network [63.69237156340457]
我々は、モデル誘導深部展開ネットワーク(MoG-DUN)と呼ばれるSISRに対する説明可能なアプローチを提示し、提唱する。
MoG-DUNは正確(エイリアスを少なくする)、計算効率(モデルパラメータを減らした)、多用途(多重劣化を処理できる)である。
RCAN, SRDNF, SRFBNを含む既存の最先端画像手法に対するMoG-DUN手法の優位性は、いくつかの一般的なデータセットと様々な劣化シナリオに関する広範な実験によって実証されている。
論文 参考訳(メタデータ) (2020-09-14T08:23:37Z) - A novel Deep Structure U-Net for Sea-Land Segmentation in Remote Sensing
Images [30.39131853354783]
本稿では,Residual Dense U-Net (RDU-Net) を用いた画素ワイド海面分割のための新しいディープニューラルネットワーク構造を提案する。
RDU-Netは、十分な結果を得るために、ダウンサンプリングとアップサンプリングの2つのパスの組み合わせである。
論文 参考訳(メタデータ) (2020-03-17T16:00:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。