論文の概要: FcaNet: Frequency Channel Attention Networks
- arxiv url: http://arxiv.org/abs/2012.11879v3
- Date: Thu, 4 Feb 2021 02:42:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 07:30:46.747961
- Title: FcaNet: Frequency Channel Attention Networks
- Title(参考訳): FcaNet: 周波数チャネル注意ネットワーク
- Authors: Zequn Qin, Pengyi Zhang, Fei Wu and Xi Li
- Abstract要約: 周波数分析を用いてチャネルアテンションを再考する。
我々は、新しいマルチスペクトルチャネルアテンションを持つFcaNetを提案する。
本手法はimagenetのtop-1精度で1.8%向上する。
- 参考スコア(独自算出の注目度): 20.6292655895549
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attention mechanism, especially channel attention, has gained great success
in the computer vision field. Many works focus on how to design efficient
channel attention mechanisms while ignoring a fundamental problem, i.e., using
global average pooling (GAP) as the unquestionable pre-processing method. In
this work, we start from a different view and rethink channel attention using
frequency analysis. Based on the frequency analysis, we mathematically prove
that the conventional GAP is a special case of the feature decomposition in the
frequency domain. With the proof, we naturally generalize the pre-processing of
channel attention mechanism in the frequency domain and propose FcaNet with
novel multi-spectral channel attention. The proposed method is simple but
effective. We can change only one line of code in the calculation to implement
our method within existing channel attention methods. Moreover, the proposed
method achieves state-of-the-art results compared with other channel attention
methods on image classification, object detection, and instance segmentation
tasks. Our method could improve by 1.8% in terms of Top-1 accuracy on ImageNet
compared with the baseline SENet-50, with the same number of parameters and the
same computational cost. Our code and models are publicly available at
https://github.com/cfzd/FcaNet.
- Abstract(参考訳): 注意機構、特にチャネルアテンションはコンピュータビジョン分野で大きな成功を収めている。
多くの研究は、グローバル平均プーリング(gap)を疑わしい前処理法として用いるという根本的な問題を無視しながら、効率的なチャネルアテンション機構を設計する方法に焦点を当てている。
本研究では、異なる視点から開始し、周波数分析を用いてチャネル注意を再考する。
周波数解析に基づいて,従来のギャップが周波数領域の特徴分解の特別な場合であることを数学的に証明する。
本研究では,周波数領域におけるチャネルアテンション機構の前処理を自然に一般化し,新しいマルチスペクトルチャンネルアテンションを用いたfcanetを提案する。
提案手法は単純だが有効である。
既存のチャネルアテンションメソッドでメソッドを実装するために、計算で1行だけコードを変更することができる。
さらに,提案手法は,画像分類,オブジェクト検出,インスタンスセグメンテーションタスクにおいて,他のチャネルアテンション手法と比較し,最先端の結果を得る。
提案手法は,ベースラインのsenet-50と比較して,imagenetのtop-1精度で1.8%向上し,同じパラメータ数と計算コストで改善することができた。
私たちのコードとモデルはhttps://github.com/cfzd/fcanetで公開されている。
関連論文リスト
- Ensemble Quadratic Assignment Network for Graph Matching [52.20001802006391]
グラフマッチングはコンピュータビジョンやパターン認識において一般的に用いられる技法である。
最近のデータ駆動型アプローチは、グラフマッチングの精度を著しく改善した。
データ駆動手法と従来の手法の利点を組み合わせたグラフニューラルネットワーク(GNN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-03-11T06:34:05Z) - OrthoNets: Orthogonal Channel Attention Networks [9.842943431749191]
我々はOrthoNetと呼ばれる新しいタイプのチャネルアテンションメカニズムを開発した。
その結果,フィルタの最適選択は解法的であり,一般化が可能であることが示唆された。
私たちのコードはhttps://github.com/hady1011/OrthoNets/で公開されています。
論文 参考訳(メタデータ) (2023-11-06T12:54:20Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - WaveNets: Wavelet Channel Attention Networks [9.842943431749191]
本稿では,チャネル表現問題の解法としてウェーブレット変換圧縮を提案する。
我々はウェーブレット圧縮を用いてチャネルアテンションを一般化し、それをウェーブネットと呼ぶ。
提案手法は, ベースラインSENetより優れ, 最先端の結果が得られる。
論文 参考訳(メタデータ) (2022-11-04T18:26:47Z) - Revisiting Random Channel Pruning for Neural Network Compression [159.99002793644163]
チャネル(または3Dフィルタ)プルーニングは、ニューラルネットワークの推論を加速する有効な方法である。
本稿では,ランダムな探索により,プルーンドモデルのチャネル構成を決定することを試みる。
この単純な戦略は、他のチャネルプルーニング手法と比較して非常にうまく機能することを示す。
論文 参考訳(メタデータ) (2022-05-11T17:59:04Z) - BA-Net: Bridge Attention for Deep Convolutional Neural Networks [4.459779019776622]
ブリッジアテンションネット(BA-Net)は,より優れたチャネルアテンション機構を実現するために提案されている。
BA-Netは、フィードフォワード時にチャネルウェイトを計算するためのよりリッチな機能を提供するだけでなく、バックフォワード時に更新されるパラメータの乗算パスも提供する。
論文 参考訳(メタデータ) (2021-12-08T07:39:18Z) - Robust MIMO Detection using Hypernetworks with Learned Regularizers [28.917679125825]
本稿では,シンボル誤り率(SER)とチャネルの一般性とのバランスをとろうとする手法を提案する。
提案手法は,特定のチャネル上で正常に動作するニューラルネットワークベースの検出器のパラメータを生成するハイパーネットワークに基づいている。
論文 参考訳(メタデータ) (2021-10-13T22:07:13Z) - Group Fisher Pruning for Practical Network Compression [58.25776612812883]
本稿では,様々な複雑な構造に応用可能な汎用チャネルプルーニング手法を提案する。
我々は、単一チャネルと結合チャネルの重要性を評価するために、フィッシャー情報に基づく統一されたメトリクスを導出する。
提案手法は,結合チャネルを含む任意の構造をプルークするために利用できる。
論文 参考訳(メタデータ) (2021-08-02T08:21:44Z) - Channel-wise Knowledge Distillation for Dense Prediction [73.99057249472735]
本稿では,学生ネットワークと教師ネットワークのチャンネルワイズ機能について提案する。
様々なネットワーク構造を持つ3つのベンチマークにおいて、一貫して優れた性能を実現している。
論文 参考訳(メタデータ) (2020-11-26T12:00:38Z) - Channel-wise Alignment for Adaptive Object Detection [66.76486843397267]
遺伝的物体検出は、ディープ畳み込みニューラルネットワークの開発によって大いに促進されている。
このタスクの既存の方法は、通常、画像全体や関心の対象に基づいて、ハイレベルなアライメントに注意を向ける。
本稿では,チャネルワイドアライメント(チャネルワイドアライメント)という,まったく異なる観点からの適応を実現する。
論文 参考訳(メタデータ) (2020-09-07T02:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。