論文の概要: SFPN: Synthetic FPN for Object Detection
- arxiv url: http://arxiv.org/abs/2203.02445v1
- Date: Fri, 4 Mar 2022 17:19:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 16:57:38.890243
- Title: SFPN: Synthetic FPN for Object Detection
- Title(参考訳): SFPN:オブジェクト検出のための合成FPN
- Authors: Yu-Ming Zhang, Jun-Wei Hsieh, Chun-Chieh Lee, Kuo-Chin Fan
- Abstract要約: 本稿では, 軽量CNNバックホンの精度を高めるため, SFPN (Synthetic Fusion Pyramid Network) Arichtectureを提案する。
SFPNアーキテクチャは、大きなバックボーンVGG16、ResNet50、またはAPスコアに基づくMobilenetV2のような軽量のバックボーンよりも優れていた。
- 参考スコア(独自算出の注目度): 6.117917355232904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: FPN (Feature Pyramid Network) has become a basic component of most SoTA one
stage object detectors. Many previous studies have repeatedly proved that FPN
can caputre better multi-scale feature maps to more precisely describe objects
if they are with different sizes. However, for most backbones such VGG, ResNet,
or DenseNet, the feature maps at each layer are downsized to their quarters due
to the pooling operation or convolutions with stride 2. The gap of
down-scaling-by-2 is large and makes its FPN not fuse the features smoothly.
This paper proposes a new SFPN (Synthetic Fusion Pyramid Network) arichtecture
which creates various synthetic layers between layers of the original FPN to
enhance the accuracy of light-weight CNN backones to extract objects' visual
features more accurately. Finally, experiments prove the SFPN architecture
outperforms either the large backbone VGG16, ResNet50 or light-weight backbones
such as MobilenetV2 based on AP score.
- Abstract(参考訳): fpn(feature pyramid network)はsoma one stage object detectorsの基本的なコンポーネントとなっている。
以前の多くの研究は、FPNがより優れたマルチスケール特徴写像を取り込み、異なる大きさの物体をより正確に記述できることを何度も証明してきた。
しかしながら、VGG、ResNet、DenseNetのようなほとんどのバックボーンでは、各レイヤのフィーチャーマップはプール操作やストライド2との畳み込みによってクォーターに縮小される。
ダウンスケールバイ-2のギャップは大きいので、FPNは機能をスムーズに融合させない。
本稿では,従来のFPNの層間に様々な合成層を形成し,軽量CNNバックホンの精度を高め,物体の視覚的特徴をより正確に抽出するSFPN(Synthetic Fusion Pyramid Network)を新たに提案する。
最後に、SFPNアーキテクチャは、大きなバックボーンVGG16、ResNet50、またはAPスコアに基づいてMobilenetV2のような軽量のバックボーンよりも優れていることを示す。
関連論文リスト
- ssFPN: Scale Sequence (S^2) Feature Based-Feature Pyramid Network for
Object Detection [4.844193288417161]
本稿では,小型物体の特徴情報を強化するために,特徴ピラミッドネットワーク(FPN)の特徴抽出手法を提案する。
提案したS2機能は,MS COCOデータセット上での1段および2段検出器の性能向上を実証する。
論文 参考訳(メタデータ) (2022-08-24T13:29:12Z) - You Should Look at All Objects [28.862053913000384]
本稿では,検出フレームワークにおけるFPNを再検討し,最適化の観点からFPNの成功の性質を明らかにする。
大規模物体の劣化特性は、FPNの統合後の不適切なバックプロパゲーションパスの発生によるものである。
バックボーンの各レベルがFPNベースの検出フレームワークの全オブジェクトを見ることができるように、2つの実行可能な戦略が提案されている。
論文 参考訳(メタデータ) (2022-07-16T09:59:34Z) - SFNet: Faster and Accurate Semantic Segmentation via Semantic Flow [88.97790684009979]
性能を改善するための一般的な実践は、強力な意味表現を持つ高解像度の特徴写像を得ることである。
隣接レベルの特徴マップ間のテキストセマンティックフローを学習するためのフローアライメントモジュール(FAM)を提案する。
また,高分解能特徴写像と低分解能特徴写像を直接整列するGated Dual Flow Alignment Moduleを提案する。
論文 参考訳(メタデータ) (2022-07-10T08:25:47Z) - RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object
Detection [10.847953426161924]
本稿では,RevFP(Reverse Feature Pyramid)とCSN(Cross-scale Shift Network)で構成されるRCNetを提案する。
RevFPは、局所的な双方向特徴融合を利用して、双方向ピラミッド推論パイプラインを簡素化する。
CSNは、隣接レベルと非隣接レベルの両方に直接表現を伝播し、より相関性の高いマルチスケール機能を実現する。
論文 参考訳(メタデータ) (2021-10-23T04:00:25Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - Implicit Feature Pyramid Network for Object Detection [22.530998243247154]
物体検出のための暗黙的特徴ピラミッドネットワーク(i-FPN)を提案する。
本稿では,深平衡モデル(DEQ)で最近導入された暗黙関数を用いてFPNの変換をモデル化する。
MSデータセットによる実験結果から,i-FPNはベースライン検出器と比較して検出性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-12-25T11:30:27Z) - Parallel Residual Bi-Fusion Feature Pyramid Network for Accurate
Single-Shot Object Detection [22.817918566911203]
本稿では,高速かつ高精度な単発物体検出のための並列残差二フュージョン特徴ピラミッドネットワーク(PRB-FPN)を提案する。
提案するネットワークは,UAVDT17およびMS COCOデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2020-12-03T06:51:20Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Temporal Pyramid Network for Action Recognition [129.12076009042622]
本稿では,2次元あるいは3次元のバックボーンネットワークに柔軟に統合可能な汎用時間ピラミッドネットワーク(TPN)を提案する。
TPNは、いくつかのアクション認識データセット上で、他の困難なベースラインよりも一貫して改善されている。
論文 参考訳(メタデータ) (2020-04-07T17:17:23Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。