論文の概要: Increasing the Accuracy of a Neural Network Using Frequency Selective
Mesh-to-Grid Resampling
- arxiv url: http://arxiv.org/abs/2209.14431v1
- Date: Wed, 28 Sep 2022 21:34:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 17:57:33.687421
- Title: Increasing the Accuracy of a Neural Network Using Frequency Selective
Mesh-to-Grid Resampling
- Title(参考訳): 周波数選択メッシュ-グリッドリサンプリングによるニューラルネットワークの精度向上
- Authors: Andreas Spruck, Viktoria Heimann, Andr\'e Kaup
- Abstract要約: ニューラルネットワークの入力データの処理にFSMR(Keypoint frequency selective mesh-to-grid resampling)を提案する。
ネットワークアーキテクチャや分類タスクによって、トレーニング中のFSMRの適用は学習プロセスに役立ちます。
ResNet50とOxflower17データセットの分類精度は最大4.31ポイント向上できる。
- 参考スコア(独自算出の注目度): 4.211128681972148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural networks are widely used for almost any task of recognizing image
content. Even though much effort has been put into investigating efficient
network architectures, optimizers, and training strategies, the influence of
image interpolation on the performance of neural networks is not well studied.
Furthermore, research has shown that neural networks are often sensitive to
minor changes in the input image leading to drastic drops of their performance.
Therefore, we propose the use of keypoint agnostic frequency selective
mesh-to-grid resampling (FSMR) for the processing of input data for neural
networks in this paper. This model-based interpolation method already showed
that it is capable of outperforming common interpolation methods in terms of
PSNR. Using an extensive experimental evaluation we show that depending on the
network architecture and classification task the application of FSMR during
training aids the learning process. Furthermore, we show that the usage of FSMR
in the application phase is beneficial. The classification accuracy can be
increased by up to 4.31 percentage points for ResNet50 and the Oxflower17
dataset.
- Abstract(参考訳): ニューラルネットワークは、画像コンテンツ認識のほとんどあらゆるタスクで広く使われている。
効率的なネットワークアーキテクチャ、オプティマイザ、トレーニング戦略の調査に多くの努力がなされているが、ニューラルネットワークの性能に対する画像補間の影響は十分に研究されていない。
さらに、研究により、ニューラルネットワークは入力画像の小さな変化に敏感で、パフォーマンスが大幅に低下することが示されている。
そこで本論文では,ニューラルネットワークの入力データの処理におけるキーポイント非依存周波数選択メッシュ-グリッドリサンプリング(fsmr)の利用を提案する。
このモデルに基づく補間法は、PSNRの点で一般的な補間法よりも優れていることを示した。
ネットワークアーキテクチャや分類タスクによって、トレーニング中のFSMRの適用が学習プロセスに役立つことを示す。
さらに,アプリケーションフェーズにおけるFSMRの利用が有用であることを示す。
ResNet50とOxflower17データセットの分類精度は最大4.31ポイント向上できる。
関連論文リスト
- Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。
我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文 参考訳(メタデータ) (2024-01-13T10:01:34Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - MDM:Visual Explanations for Neural Networks via Multiple Dynamic Mask [5.333582981327497]
本稿では,推論プロセスの解釈可能性を備えた汎用のサリエンシグラフクエリ手法であるMultiple Dynamic Mask(MDM)を提案する。
MDMサリエンシマップ探索アルゴリズムでは、様々なサリエンシマップ探索法の性能指標と、トレーニングされたニューラルネットワークとしてResNetとDenseNetを用いてMDMの性能指標を実験的に比較した。
論文 参考訳(メタデータ) (2022-07-17T00:25:16Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - RSI-Net: Two-Stream Deep Neural Network Integrating GCN and Atrous CNN
for Semantic Segmentation of High-resolution Remote Sensing Images [3.468780866037609]
本稿では,リモートセンシング画像(RSI-Net)のセマンティックセグメンテーションのための2ストリームディープニューラルネットワークを提案する。
実験はVayhingen、Potsdam、Gaofen RSIデータセットで実施されている。
その結果,6つの最先端RSIセマンティックセグメンテーション法と比較して,総合的精度,F1スコア,カッパ係数において,RSI-Netの優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-19T15:57:20Z) - Over-and-Under Complete Convolutional RNN for MRI Reconstruction [57.95363471940937]
MR画像再構成のための最近のディープラーニングに基づく手法は、通常、汎用的なオートエンコーダアーキテクチャを利用する。
OUCR(Over-and-Under Complete Convolu?tional Recurrent Neural Network)を提案する。
提案手法は, トレーニング可能なパラメータの少ない圧縮されたセンシングと, 一般的なディープラーニングに基づく手法に対して, 大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-06-16T15:56:34Z) - Implementing a foveal-pit inspired filter in a Spiking Convolutional
Neural Network: a preliminary study [0.0]
我々は,網膜卵管刺激によるガウスフィルタとランク順符号化の差異を取り入れたスポーキング畳み込みニューラルネットワーク(SCNN)を提示した。
このモデルは、Nengoライブラリーで実装されているように、スパイキングニューロンで動作するように適応されたバックプロパゲーションアルゴリズムの変種を用いて訓練される。
ネットワークは最大90%の精度で達成され、損失はクロスエントロピー関数を用いて計算される。
論文 参考訳(メタデータ) (2021-05-29T15:28:30Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - A Hybrid Method for Training Convolutional Neural Networks [3.172761915061083]
本稿では,畳み込みニューラルネットワークの学習にバックプロパゲーションと進化戦略の両方を用いるハイブリッド手法を提案する。
画像分類のタスクにおいて,提案手法は定期的な訓練において改善可能であることを示す。
論文 参考訳(メタデータ) (2020-04-15T17:52:48Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。