論文の概要: Object Detection based on OcSaFPN in Aerial Images with Noise
- arxiv url: http://arxiv.org/abs/2012.09859v1
- Date: Fri, 18 Dec 2020 01:28:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:15:13.826378
- Title: Object Detection based on OcSaFPN in Aerial Images with Noise
- Title(参考訳): OcSaFPNによるノイズのある空中画像の物体検出
- Authors: Chengyuan Li, Jun Liu, Hailong Hong, Wenju Mao, Chenjie Wang, Chudi
Hu, Xin Su, Bin Luo
- Abstract要約: オクターブ畳み込みに基づく意味的注意特徴ピラミッドネットワーク(OcSaFPN)は、ノイズによる物体検出の精度を高めるために提案されている。
提案アルゴリズムは,3つのデータセットで検証し,ガウス雑音や乗法雑音による最先端検出性能を実現する。
- 参考スコア(独自算出の注目度): 9.587619619262716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Taking the deep learning-based algorithms into account has become a crucial
way to boost object detection performance in aerial images. While various
neural network representations have been developed, previous works are still
inefficient to investigate the noise-resilient performance, especially on
aerial images with noise taken by the cameras with telephoto lenses, and most
of the research is concentrated in the field of denoising. Of course, denoising
usually requires an additional computational burden to obtain higher quality
images, while noise-resilient is more of a description of the robustness of the
network itself to different noises, which is an attribute of the algorithm
itself. For this reason, the work will be started by analyzing the
noise-resilient performance of the neural network, and then propose two
hypotheses to build a noise-resilient structure. Based on these hypotheses, we
compare the noise-resilient ability of the Oct-ResNet with frequency division
processing and the commonly used ResNet. In addition, previous feature pyramid
networks used for aerial object detection tasks are not specifically designed
for the frequency division feature maps of the Oct-ResNet, and they usually
lack attention to bridging the semantic gap between diverse feature maps from
different depths. On the basis of this, a novel octave convolution-based
semantic attention feature pyramid network (OcSaFPN) is proposed to get higher
accuracy in object detection with noise. The proposed algorithm tested on three
datasets demonstrates that the proposed OcSaFPN achieves a state-of-the-art
detection performance with Gaussian noise or multiplicative noise. In addition,
more experiments have proved that the OcSaFPN structure can be easily added to
existing algorithms, and the noise-resilient ability can be effectively
improved.
- Abstract(参考訳): 深層学習に基づくアルゴリズムを考慮に入れることは、空中画像における物体検出性能を高める重要な方法となっている。
様々なニューラルネットワーク表現が開発されているが、従来の研究は、特に望遠レンズ付きカメラで撮影されたノイズのある空中画像において、ノイズ回復性能を調べるのに非効率であり、ほとんどの研究はノイズ除去の分野に集中している。
ノイズレジリエントは、アルゴリズム自体の属性である異なるノイズに対するネットワーク自体の堅牢性の記述である。
このため、ニューラルネットワークの雑音回復性能を分析し、ノイズ回復構造を構築するための2つの仮説を提案する。
これらの仮説に基づき,oct-resnetの耐雑音性能と周波数分割処理と一般のresnetを比較した。
また,従来はOcto-ResNetの周波数分割特徴マップのためには設計されておらず,異なる深度から多様な特徴マップ間の意味的ギャップを埋めることに注意が払われている。
このことから,新しいオクターブ畳み込み型セマンティックアテンション特徴ピラミッドネットワーク(OcSaFPN)が提案され,ノイズによる物体検出の精度が向上した。
3つのデータセットでテストされた提案アルゴリズムは,提案手法がガウス雑音や乗法雑音を伴う最先端検出性能を実現することを示す。
さらに、OcSaFPN構造を既存のアルゴリズムに簡単に付加でき、耐雑音性能を効果的に向上できることが多くの実験で証明されている。
関連論文リスト
- CFNet: Conditional Filter Learning with Dynamic Noise Estimation for
Real Image Denoising [37.29552796977652]
本稿では、カメラ内信号処理パイプラインを用いた異方性ガウス/ポアソンガウス分布によって近似された実雑音について考察する。
本稿では,特徴位置の異なる最適なカーネルを画像とノイズマップの局所的特徴により適応的に推定できる条件付きフィルタを提案する。
また,CNN構造にノイズ推定や非ブラインド復調を行う場合,反復的特徴復調を導出する前に連続的にノイズを更新すると考える。
論文 参考訳(メタデータ) (2022-11-26T14:28:54Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - Poisson2Sparse: Self-Supervised Poisson Denoising From a Single Image [34.27748767631027]
本稿では,単一画像の自己教師型学習手法を提案する。
繰り返しニューラルネットワークを用いた画像復調のための従来の反復最適化アルゴリズムを近似する。
提案手法はPSNRとSSIMの両面で最先端の手法より優れている。
論文 参考訳(メタデータ) (2022-06-04T00:08:58Z) - Learning to Generate Realistic Noisy Images via Pixel-level Noise-aware
Adversarial Training [50.018580462619425]
我々は,PNGAN(Pixel-level Noise-aware Generative Adrial Network)という新しいフレームワークを提案する。
PNGANは、トレーニング済みのリアルデノイザーを使用して、フェイク画像とリアルノイズ画像をほぼノイズのないソリューション空間にマッピングする。
より優れたノイズフィッティングを実現するため,ジェネレータとしてSimple Multi-versa-scale Network (SMNet) を提案する。
論文 参考訳(メタデータ) (2022-04-06T14:09:02Z) - Zero-shot Blind Image Denoising via Implicit Neural Representations [77.79032012459243]
暗黙的ニューラル表現(INR)のアーキテクチャ的帰納的バイアスを利用した代替的認知戦略を提案する。
提案手法は,低雑音シナリオや実雑音シナリオの広い範囲において,既存のゼロショット復調手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-05T12:46:36Z) - Image Denoising using Attention-Residual Convolutional Neural Networks [0.0]
本稿では,学習に基づく新たな非盲検手法であるAttention Residual Convolutional Neural Network (ARCNN)を提案し,その拡張としてFlexible Attention Residual Convolutional Neural Network (FARCNN)を提案する。
ARCNNはガウス語とポアソン語で約0.44dBと0.96dBの平均PSNR結果を達成し、FARCNNはARCNNに比べて若干パフォーマンスが悪くても非常に一貫した結果を示した。
論文 参考訳(メタデータ) (2021-01-19T16:37:57Z) - Neighbor2Neighbor: Self-Supervised Denoising from Single Noisy Images [98.82804259905478]
Neighbor2Neighborを提示し、ノイズの多い画像のみで効果的な画像消音モデルをトレーニングします。
ネットワークのトレーニングに使用される入力とターゲットは、同じノイズ画像からサブサンプリングされた画像である。
デノイジングネットワークは、第1段階で生成されたサブサンプルトレーニングペアで訓練され、提案された正規化器は、より良いパフォーマンスのための追加の損失として訓練される。
論文 参考訳(メタデータ) (2021-01-08T02:03:25Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Evolving Deep Convolutional Neural Networks for Hyperspectral Image
Denoising [6.869192200282213]
本稿では,HSIを効果的に識別する最適な畳み込みニューラルネットワーク(CNN)を自動構築する新しいアルゴリズムを提案する。
提案アルゴリズムの実験は、最先端の競合相手とよく設計され比較されている。
論文 参考訳(メタデータ) (2020-08-15T03:04:11Z) - Robust Processing-In-Memory Neural Networks via Noise-Aware
Normalization [26.270754571140735]
PIM加速器は、しばしば物理的成分の固有のノイズに悩まされる。
雑音設定に対してロバストなニューラルネットワーク性能を実現するためのノイズ非依存手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T06:51:28Z) - Variational Denoising Network: Toward Blind Noise Modeling and Removal [59.36166491196973]
ブラインド画像のデノイングはコンピュータビジョンにおいて重要な問題であるが、非常に難しい問題である。
本稿では,ノイズ推定と画像デノーミングを併用した新しい変分推論手法を提案する。
論文 参考訳(メタデータ) (2019-08-29T15:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。