論文の概要: AFPN: Asymptotic Feature Pyramid Network for Object Detection
- arxiv url: http://arxiv.org/abs/2306.15988v2
- Date: Sun, 24 Sep 2023 12:45:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 02:01:34.054554
- Title: AFPN: Asymptotic Feature Pyramid Network for Object Detection
- Title(参考訳): AFPN:オブジェクト検出のための漸近的特徴ピラミッドネットワーク
- Authors: Guoyu Yang, Jie Lei, Zhikuan Zhu, Siyu Cheng, Zunlei Feng, Ronghua
Liang
- Abstract要約: 本稿では,非隣接レベルでの直接対話を支援する機能ピラミッドネットワーク(AFPN)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させ、融合プロセスに高レベル特徴を実現する。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
- 参考スコア(独自算出の注目度): 16.86715579071991
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-scale features are of great importance in encoding objects with scale
variance in object detection tasks. A common strategy for multi-scale feature
extraction is adopting the classic top-down and bottom-up feature pyramid
networks. However, these approaches suffer from the loss or degradation of
feature information, impairing the fusion effect of non-adjacent levels. This
paper proposes an asymptotic feature pyramid network (AFPN) to support direct
interaction at non-adjacent levels. AFPN is initiated by fusing two adjacent
low-level features and asymptotically incorporates higher-level features into
the fusion process. In this way, the larger semantic gap between non-adjacent
levels can be avoided. Given the potential for multi-object information
conflicts to arise during feature fusion at each spatial location, adaptive
spatial fusion operation is further utilized to mitigate these inconsistencies.
We incorporate the proposed AFPN into both two-stage and one-stage object
detection frameworks and evaluate with the MS-COCO 2017 validation and test
datasets. Experimental evaluation shows that our method achieves more
competitive results than other state-of-the-art feature pyramid networks. The
code is available at
\href{https://github.com/gyyang23/AFPN}{https://github.com/gyyang23/AFPN}.
- Abstract(参考訳): マルチスケール機能は、オブジェクト検出タスクのばらつきを伴うオブジェクトのエンコーディングにおいて非常に重要である。
マルチスケール機能抽出のための一般的な戦略は、古典的なトップダウンおよびボトムアップ機能ピラミッドネットワークを採用することだ。
しかし,これらの手法は特徴情報の喪失や劣化に悩まされ,非隣接レベルの融合効果を損なう。
本稿では,非隣接レベルで直接インタラクションをサポートする漸近的特徴ピラミッドネットワーク(afpn)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させて開始され、漸近的に高レベル特徴を融合プロセスに組み込む。
このように、非隣接レベル間の大きな意味的ギャップを回避できる。
各空間位置における特徴融合時に発生する多目的情報衝突の可能性を考えると、適応的な空間融合操作によりこれらの矛盾を軽減できる。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
実験結果から,本手法は他の最先端機能ピラミッドネットワークよりも高い競合性が得られた。
コードは \href{https://github.com/gyyang23/afpn}{https://github.com/gyyang23/afpn} で入手できる。
関連論文リスト
- DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Skipped Feature Pyramid Network with Grid Anchor for Object Detection [6.99246486061412]
特徴ピラミッドの各レベルにおいてより強力な意味論を得るために,スキップ接続を提案する。
提案手法では,各レベルが一定スケールの物体を検知する責任を負うことがより合理的である。
論文 参考訳(メタデータ) (2023-10-22T23:27:05Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - You Should Look at All Objects [28.862053913000384]
本稿では,検出フレームワークにおけるFPNを再検討し,最適化の観点からFPNの成功の性質を明らかにする。
大規模物体の劣化特性は、FPNの統合後の不適切なバックプロパゲーションパスの発生によるものである。
バックボーンの各レベルがFPNベースの検出フレームワークの全オブジェクトを見ることができるように、2つの実行可能な戦略が提案されている。
論文 参考訳(メタデータ) (2022-07-16T09:59:34Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。