論文の概要: Optimal Weighted Convolution for Classification and Denosing
- arxiv url: http://arxiv.org/abs/2505.24558v1
- Date: Fri, 30 May 2025 13:10:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.962089
- Title: Optimal Weighted Convolution for Classification and Denosing
- Title(参考訳): 分類とデノシングのための最適重み付き畳み込み
- Authors: Simone Cammarasana, Giuseppe Patanè,
- Abstract要約: 従来の畳み込みニューラルネットワーク(CNN)を強化する新しい重み付き畳み込み演算子を導入する。
この拡張により、ネットワークは基準画素に対する相対位置に基づいて隣接画素を微分重み付けすることができる。
2次元画像データのために開発されたが、任意の次元の正規格子上の信号に一般化可能である。
- 参考スコア(独自算出の注目度): 6.6942213231641805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a novel weighted convolution operator that enhances traditional convolutional neural networks (CNNs) by integrating a spatial density function into the convolution operator. This extension enables the network to differentially weight neighbouring pixels based on their relative position to the reference pixel, improving spatial characterisation and feature extraction. The proposed operator maintains the same number of trainable parameters and is fully compatible with existing CNN architectures. Although developed for 2D image data, the framework is generalisable to signals on regular grids of arbitrary dimensions, such as 3D volumetric data or 1D time series. We propose an efficient implementation of the weighted convolution by pre-computing the density function and achieving execution times comparable to standard convolution layers. We evaluate our method on two deep learning tasks: image classification using the CIFAR-100 dataset [KH+09] and image denoising using the DIV2K dataset [AT17]. Experimental results with state-of-the-art classification (e.g., VGG [SZ15], ResNet [HZRS16]) and denoising (e.g., DnCNN [ZZC+17], NAFNet [CCZS22]) methods show that the weighted convolution improves performance with respect to standard convolution across different quantitative metrics. For example, VGG achieves an accuracy of 66.94% with weighted convolution versus 56.89% with standard convolution on the classification problem, while DnCNN improves the PSNR value from 20.17 to 22.63 on the denoising problem. All models were trained on the CINECA Leonardo cluster to reduce the execution time and improve the tuning of the density function values. The PyTorch implementation of the weighted convolution is publicly available at: https://github.com/cammarasana123/weightedConvolution2.0.
- Abstract(参考訳): 本稿では、空間密度関数を畳み込み演算子に統合することにより、従来の畳み込みニューラルネットワーク(CNN)を強化する新しい重み付き畳み込み演算子を提案する。
この拡張により、ネットワークは、基準画素に対する相対的な位置に基づいて、隣接画素を微分重み付けし、空間的特徴化と特徴抽出を改善することができる。
提案した演算子は、トレーニング可能なパラメータの数と同じであり、既存のCNNアーキテクチャと完全に互換性がある。
2次元画像データのために開発されたが、このフレームワークは3次元ボリュームデータや1次元時系列などの任意の次元の正規グリッド上の信号に一般化可能である。
本稿では,密度関数を事前計算し,標準畳み込み層に匹敵する実行時間を実現することで,重み付き畳み込みの効率的な実装を提案する。
我々は,CIFAR-100データセット [KH+09] を用いた画像分類と,DIV2Kデータセット [AT17] を用いた画像復調という2つの深層学習課題について評価を行った。
最先端の分類 (eg, VGG [SZ15], ResNet [HZRS16]) と denoising (eg, DnCNN [ZZC+17], NAFNet [CCZS22]) による実験結果から, 重み付き畳み込みは, 異なるメトリクスの標準畳み込みに関して, 性能を向上させることが示された。
例えば、VGGは重み付き畳み込みで66.94%、標準畳み込みで56.89%、DnCNNは乗法問題でPSNR値を20.17から22.63に改善する。
全てのモデルはCINECA Leonardoクラスタでトレーニングされ、実行時間を短縮し、密度関数値のチューニングを改善した。
重み付き畳み込みのPyTorch実装は、https://github.com/cammarasana123/weightedConvolution2.0で公開されている。
関連論文リスト
- Optimal Density Functions for Weighted Convolution in Learning Models [6.6942213231641805]
本稿では、正規格子上で定義された信号の畳み込みに対する新しいアプローチである重み付き畳み込みについて紹介する。
重み付き畳み込みは畳み込みニューラルネットワーク問題に適用でき、近似精度を向上させることができる。
今後の研究は、重み付き畳み込みを実例2Dおよび3D画像畳み込み学習問題に適用する予定である。
論文 参考訳(メタデータ) (2025-05-30T12:36:36Z) - GMConv: Modulating Effective Receptive Fields for Convolutional Kernels [52.50351140755224]
畳み込みニューラルネットワークでは、固定N$times$N受容場(RF)を持つ正方形カーネルを用いて畳み込みを行う。
ERFが通常ガウス分布を示す性質に着想を得て,本研究でガウス・マスク畳み込みカーネル(GMConv)を提案する。
私たちのGMConvは、既存のCNNの標準の畳み込みを直接置き換えることができ、標準のバックプロパゲーションによって、エンドツーエンドで簡単に訓練することができます。
論文 参考訳(メタデータ) (2023-02-09T10:17:17Z) - An Improved Normed-Deformable Convolution for Crowd Counting [70.02434289611566]
頭の中のCNN機能のスケール適応機能を活用するために、変形可能な畳み込みを提案する。
本論文では,改良されたノーマッド・デフォルマブル・コンボリューション(textiti.e.NDConv)を提案する。
本手法は,上海技術A,上海技術B,UCF_QNRF,UCF_CC_50データセットの最先端手法より優れている。
論文 参考訳(メタデータ) (2022-06-16T10:56:26Z) - Dilated convolution with learnable spacings [6.6389732792316005]
CNNは視覚変換器と競合するために受容野(RF)を必要とする。
RFは、畳み込みカーネルのサイズを増やすことで簡単に拡大できる。
トレーニング可能なパラメータの数は、2Dの場合、カーネルのサイズと4倍にスケールするが、急速に禁止される。
本稿では,パラメータ数を増大させることなくRFサイズを増大させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-07T14:54:24Z) - Content-Aware Convolutional Neural Networks [98.97634685964819]
畳み込みニューラルネットワーク(CNN)は、畳み込み層の強力な特徴学習能力によって大きな成功を収めている。
本研究では,スムーズなウィンドウを自動的に検出し,元の大規模カーネルを置き換えるために1x1畳み込みカーネルを適用するContent-aware Convolution (CAC)を提案する。
論文 参考訳(メタデータ) (2021-06-30T03:54:35Z) - Decoupled Dynamic Filter Networks [85.38058820176047]
これらの欠点を同時に解決できるDDF(Decoupled Dynamic Filter)を提案します。
最近の注目の高まりに触発されて、DDFは深度ワイドなダイナミックフィルタを空間的およびチャネル的ダイナミックフィルタに分離する。
分類ネットワークにおける標準畳み込みをDFFに置き換える際の性能向上を観察する。
論文 参考訳(メタデータ) (2021-04-29T04:55:33Z) - Efficient Deep Image Denoising via Class Specific Convolution [24.103826414190216]
画素ワイズ分類に基づく画像復調のための効率的なディープニューラルネットワークを提案する。
提案手法は性能を犠牲にすることなく計算コストを削減できる。
論文 参考訳(メタデータ) (2021-03-02T10:28:15Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。