論文の概要: CE-FPN: Enhancing Channel Information for Object Detection
- arxiv url: http://arxiv.org/abs/2103.10643v1
- Date: Fri, 19 Mar 2021 05:51:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:33:12.424465
- Title: CE-FPN: Enhancing Channel Information for Object Detection
- Title(参考訳): CE-FPN:物体検出のためのチャネル情報強化
- Authors: Yihao Luo, Xiang Cao, Juntao Zhang, Xiang Cao, Jingjuan Guo, Haibo
Shen, Tianjiang Wang and Qi Feng
- Abstract要約: 特徴ピラミッドネットワーク(FPN)は,オブジェクト検出におけるマルチスケール特徴の抽出に有効なフレームワークである。
3つのシンプルで効果的なモジュールを備えた新しいチャネル強化ネットワーク(CE-FPN)を提示し、これらの問題を軽減します。
実験の結果, CE-FPNはMS COCOベンチマークの最先端FPN検出器と比較して, 競争性能が向上していることがわかった。
- 参考スコア(独自算出の注目度): 12.954675966833372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature pyramid network (FPN) has been an effective framework to extract
multi-scale features in object detection. However, current FPN-based methods
mostly suffer from the intrinsic flaw of channel reduction, which brings about
the loss of semantical information. And the miscellaneous fused feature maps
may cause serious aliasing effects. In this paper, we present a novel channel
enhancement feature pyramid network (CE-FPN) with three simple yet effective
modules to alleviate these problems. Specifically, inspired by sub-pixel
convolution, we propose a sub-pixel skip fusion method to perform both channel
enhancement and upsampling. Instead of the original 1x1 convolution and linear
upsampling, it mitigates the information loss due to channel reduction. Then we
propose a sub-pixel context enhancement module for extracting more feature
representations, which is superior to other context methods due to the
utilization of rich channel information by sub-pixel convolution. Furthermore,
a channel attention guided module is introduced to optimize the final
integrated features on each level, which alleviates the aliasing effect only
with a few computational burdens. Our experiments show that CE-FPN achieves
competitive performance compared to state-of-the-art FPN-based detectors on MS
COCO benchmark.
- Abstract(参考訳): 特徴ピラミッドネットワーク(FPN)は,オブジェクト検出におけるマルチスケール特徴抽出に有効なフレームワークである。
しかし、現在のFPNベースの手法は、主にチャネル還元の本質的な欠陥に悩まされ、セマンティックな情報が失われる。
そして、雑多な融合特徴マップは深刻なエイリアス効果を引き起こす可能性がある。
本稿では,これらの問題を解決するための,単純かつ効果的なモジュールを3つ備えた新しいチャネル拡張機能ピラミッドネットワーク(ce-fpn)を提案する。
具体的には,サブピクセル畳み込みに触発されて,チャネル拡張とアップサンプリングの両方を行うサブピクセルスキップ融合法を提案する。
元の1x1畳み込みや線形アップサンプリングの代わりに、チャネル削減による情報損失を軽減する。
そこで,我々は,サブピクセル畳み込みによるリッチチャネル情報の利用により,他のコンテキストメソッドよりも優れた特徴表現を抽出するサブピクセルコンテキスト拡張モジュールを提案する。
さらに、各レベルの最終的な統合機能を最適化するためにチャンネル注意誘導モジュールを導入し、わずかな計算負荷でエイリアス効果を緩和する。
実験の結果, CE-FPNはMS COCOベンチマークの最先端FPN検出器と比較して, 競争性能が向上していることがわかった。
関連論文リスト
- Accurate and lightweight dehazing via multi-receptive-field non-local
network and novel contrastive regularization [9.90146712189936]
本稿では,マルチ受信フィールド非局所ネットワーク(MRFNLN)を提案する。
マルチストリーム機能アテンションブロック(MSFAB)とクロス非ローカルブロック(CNLB)として設計されている。
これは、150万のパラメータ未満の最近の最先端の脱ハージング手法よりも優れています。
論文 参考訳(メタデータ) (2023-09-28T14:59:16Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Spatially-Adaptive Feature Modulation for Efficient Image
Super-Resolution [90.16462805389943]
視覚変換器(ViT)のようなブロック上に,空間適応型特徴変調(SAFM)機構を開発する。
提案法は最先端のSR法よりも3倍程度小さい。
論文 参考訳(メタデータ) (2023-02-27T14:19:31Z) - Improved-Flow Warp Module for Remote Sensing Semantic Segmentation [9.505303195320023]
リモートセンシングセマンティックセグメンテーションのために,異なるスケールのセマンティックな特徴マップを調整するための改良フローワープモジュール (IFWM) を提案する。
IFWMは、画素のオフセットを学習可能な方法で計算し、マルチスケール機能の誤調整を軽減する。
提案手法を複数のリモートセンシングデータセットで検証し,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-05-09T10:15:18Z) - TRACER: Extreme Attention Guided Salient Object Tracing Network [3.2434811678562676]
本稿では,注意誘導型トレーシングモジュールを組み込んで,鮮明なエッジで有意な物体を検出するTRACERを提案する。
13の既存手法との比較により、TRACERは5つのベンチマークデータセットで最先端のパフォーマンスを達成することが明らかになった。
論文 参考訳(メタデータ) (2021-12-14T13:20:07Z) - Group Fisher Pruning for Practical Network Compression [58.25776612812883]
本稿では,様々な複雑な構造に応用可能な汎用チャネルプルーニング手法を提案する。
我々は、単一チャネルと結合チャネルの重要性を評価するために、フィッシャー情報に基づく統一されたメトリクスを導出する。
提案手法は,結合チャネルを含む任意の構造をプルークするために利用できる。
論文 参考訳(メタデータ) (2021-08-02T08:21:44Z) - EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation [62.210091681352914]
自律運転やロボティクスなど,多くのアプリケーションを対象とした3次元セマンティックセマンティックセグメンテーションのためのマルチセンサフュージョンについて検討する。
本研究では,知覚認識型マルチセンサフュージョン(PMF)と呼ばれる協調融合方式について検討する。
本稿では,2つのモードから特徴を分離して抽出する2ストリームネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-21T10:47:26Z) - Feature Flow: In-network Feature Flow Estimation for Video Object
Detection [56.80974623192569]
光の流れはコンピュータビジョンのタスクで広く使われ、ピクセルレベルのモーション情報を提供する。
一般的なアプローチは、ニューラルネットワークへの前向き光学フローと、タスクデータセット上のこのネットワークの微調整である。
ビデオオブジェクト検出のための textbfIn-network textbfFeature textbfFlow 推定モジュールを用いた新しいネットワーク (IFF-Net) を提案する。
論文 参考訳(メタデータ) (2020-09-21T07:55:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。