論文の概要: Frequency Disentangled Residual Network
- arxiv url: http://arxiv.org/abs/2109.12556v1
- Date: Sun, 26 Sep 2021 10:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:26:57.866607
- Title: Frequency Disentangled Residual Network
- Title(参考訳): 周波数分散残差ネットワーク
- Authors: Satya Rajendra Singh, Roshan Reddy Yedla, Shiv Ram Dubey, Rakesh
Sanodiya, Wei-Ta Chu
- Abstract要約: ResNet(Residual Networks)は様々なコンピュータビジョンや画像処理アプリケーションに利用されている。
残留ブロックは、トレーニング可能なパラメータを持つ少数の畳み込み層で構成され、過度に適合する。
これらの問題に対処するために、周波数不整合残差ネットワーク(FDResNet)を提案する。
- 参考スコア(独自算出の注目度): 11.388328269522006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Residual networks (ResNets) have been utilized for various computer vision
and image processing applications. The residual connection improves the
training of the network with better gradient flow. A residual block consists of
few convolutional layers having trainable parameters, which leads to
overfitting. Moreover, the present residual networks are not able to utilize
the high and low frequency information suitably, which also challenges the
generalization capability of the network. In this paper, a frequency
disentangled residual network (FDResNet) is proposed to tackle these issues.
Specifically, FDResNet includes separate connections in the residual block for
low and high frequency components, respectively. Basically, the proposed model
disentangles the low and high frequency components to increase the
generalization ability. Moreover, the computation of low and high frequency
components using fixed filters further avoids the overfitting. The proposed
model is tested on benchmark CIFAR10/100, Caltech and TinyImageNet datasets for
image classification. The performance of the proposed model is also tested in
image retrieval framework. It is noticed that the proposed model outperforms
its counterpart residual model. The effect of kernel size and standard
deviation is also evaluated. The impact of the frequency disentangling is also
analyzed using saliency map.
- Abstract(参考訳): ResNet(Residual Networks)は様々なコンピュータビジョンや画像処理アプリケーションに利用されている。
残差接続は勾配流を良くすることでネットワークのトレーニングを改善する。
残留ブロックは、トレーニング可能なパラメータを持つ少数の畳み込み層で構成され、過度に適合する。
さらに、現在の残余ネットワークは、高・低周波情報を適切に利用することができず、ネットワークの一般化能力にも挑戦している。
本稿では,これらの問題に対処するため,周波数不整合残差ネットワーク(FDResNet)を提案する。
具体的には、fdresnetは、低周波コンポーネントと高周波コンポーネントの残差ブロックの分離接続を含む。
提案手法は,低周波成分と高周波成分を分離し,一般化能力を高める。
さらに, 固定フィルタを用いた低周波および高周波成分の計算により, オーバーフィッティングが回避される。
提案モデルは、画像分類のためのベンチマークCIFAR10/100、Caltech、TinyImageNetデータセットでテストされる。
また,提案モデルの性能を画像検索フレームワークで検証した。
提案モデルがそれと相反する残差モデルを上回っていることに気付く。
カーネルサイズと標準偏差の影響も評価した。
また, 周波数分離の影響を, サリエンシマップを用いて解析した。
関連論文リスト
- Efficient View Synthesis with Neural Radiance Distribution Field [61.22920276806721]
我々は,リアルタイムに効率的なビュー合成を目標とするニューラルレージアンス分布場(NeRDF)という新しい表現を提案する。
我々は、NeLFのように1ピクセル当たりの1つのネットワーク転送でレンダリング速度を保ちながら、NeRFに似た小さなネットワークを使用する。
実験の結果,提案手法は既存の手法よりも速度,品質,ネットワークサイズとのトレードオフが良好であることがわかった。
論文 参考訳(メタデータ) (2023-08-22T02:23:28Z) - Frequency Compensated Diffusion Model for Real-scene Dehazing [6.105813272271171]
本研究では,実ヘイズへの一般化を改善する条件付き拡散モデルに基づく脱ヘイズフレームワークについて考察する。
提案手法は, 実世界の画像において, 最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-08-21T06:50:44Z) - Frequency Dropout: Feature-Level Regularization via Randomized Filtering [24.53978165468098]
深層畳み込みニューラルネットワークは、トレーニング信号から急激な相関を拾うことができる。
本稿では、畳み込みニューラルネットワークが周波数固有の画像特徴を学習するのを防ぐためのトレーニング戦略である周波数ドロップアウトを提案する。
提案手法は,予測精度の向上だけでなく,ドメインシフトに対する堅牢性の向上も示唆している。
論文 参考訳(メタデータ) (2022-09-20T16:42:21Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Test-Time Adaptation for Super-Resolution: You Only Need to Overfit on a
Few More Images [12.846479438896338]
事前訓練されたSRネットワークからHR予測の知覚品質を改善するためのシンプルで普遍的なアプローチを提案します。
知覚品質とPSNR/SSIM値の点で、画像に対する微調整の効果を示します。
論文 参考訳(メタデータ) (2021-04-06T16:50:52Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - Focal Frequency Loss for Image Reconstruction and Synthesis [125.7135706352493]
周波数領域の狭さが画像再構成と合成品質をさらに改善できることを示す。
本稿では,合成が難しい周波数成分に適応的に焦点を合わせることのできる,新しい焦点周波数損失を提案する。
論文 参考訳(メタデータ) (2020-12-23T17:32:04Z) - Iterative Network for Image Super-Resolution [69.07361550998318]
単一画像超解像(SISR)は、最近の畳み込みニューラルネットワーク(CNN)の発展により、大幅に活性化されている。
本稿では、従来のSISRアルゴリズムに関する新たな知見を提供し、反復最適化に依存するアプローチを提案する。
反復最適化の上に,新しい反復型超解像ネットワーク (ISRN) を提案する。
論文 参考訳(メタデータ) (2020-05-20T11:11:47Z) - Network Adjustment: Channel Search Guided by FLOPs Utilization Ratio [101.84651388520584]
本稿では,ネットワークの精度をFLOPの関数として考慮した,ネットワーク調整という新しいフレームワークを提案する。
標準画像分類データセットと幅広いベースネットワークの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2020-04-06T15:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。