論文の概要: Rethinking Features-Fused-Pyramid-Neck for Object Detection
- arxiv url: http://arxiv.org/abs/2505.12820v1
- Date: Mon, 19 May 2025 08:01:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.47446
- Title: Rethinking Features-Fused-Pyramid-Neck for Object Detection
- Title(参考訳): 物体検出のための特徴フューズドピラミドネックの再考
- Authors: Hulin Li,
- Abstract要約: 本稿では,マルチヘッド検出器における特徴アンフューズドピラミドネックの有効性を評価するために,独立階層ピラミッド(IHP)アーキテクチャを提案する。
また,各階層における特徴核融合の影響を軽減するために,重度下降係数を持つ軟質近傍(SNI)も導入した。
これらの進歩は,Pascal および MS におけるリアルタイム検出のための二次特徴アライメントソリューション (SA) で達成され,最先端の結果が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-head detectors typically employ a features-fused-pyramid-neck for multi-scale detection and are widely adopted in the industry. However, this approach faces feature misalignment when representations from different hierarchical levels of the feature pyramid are forcibly fused point-to-point. To address this issue, we designed an independent hierarchy pyramid (IHP) architecture to evaluate the effectiveness of the features-unfused-pyramid-neck for multi-head detectors. Subsequently, we introduced soft nearest neighbor interpolation (SNI) with a weight downscaling factor to mitigate the impact of feature fusion at different hierarchies while preserving key textures. Furthermore, we present a features adaptive selection method for down sampling in extended spatial windows (ESD) to retain spatial features and enhance lightweight convolutional techniques (GSConvE). These advancements culminate in our secondary features alignment solution (SA) for real-time detection, achieving state-of-the-art results on Pascal VOC and MS COCO. Code will be released at https://github.com/AlanLi1997/rethinking-fpn. This paper has been accepted by ECCV2024 and published on Springer Nature.
- Abstract(参考訳): マルチヘッド検出器は通常、マルチスケール検出に機能融合ピラミドネックを使用し、業界で広く採用されている。
しかし、特徴ピラミッドの異なる階層レベルの表現が強制的にポイント・ツー・ポイントである場合、このアプローチは特徴の不一致に直面します。
この問題に対処するため,我々は,マルチヘッド検出器における特徴未使用ピラミドネックの有効性を評価するために,独立階層ピラミッド(IHP)アーキテクチャを設計した。
その後,鍵テクスチャを保ちながら,異なる階層における特徴融合の影響を軽減するために,重度下降因子を付加した軟部近傍補間(SNI)を導入した。
さらに,空間的特徴を保ち,軽量な畳み込み技術(GSConvE)を向上させるため,拡張空間ウィンドウ(ESD)におけるダウンサンプリングのための特徴適応的選択手法を提案する。
これらの進歩は,Pascal VOCとMS COCOの2次機能アライメントソリューション(SA)を用いてリアルタイム検出を行い,最先端の成果が得られた。
コードはhttps://github.com/AlanLi1997/rethinking-fpn.comでリリースされる。
この論文はECCV2024で受け入れられ、Springer Natureに掲載されている。
関連論文リスト
- A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - AMANet: Advancing SAR Ship Detection with Adaptive Multi-Hierarchical
Attention Network [0.5437298646956507]
適応型多階層型アテンションモジュール (AMAM) を提案する。
まず,隣り合う特徴層からの情報を融合して,より小さなターゲットの検出を強化し,マルチスケールな特徴強調を実現する。
第3に,AMAMをバックボーンネットワークと特徴ピラミッドネットワークに埋め込むことにより,適応型多階層アテンションネットワーク(AMANet)を提案する。
論文 参考訳(メタデータ) (2024-01-24T03:56:33Z) - AFPN: Asymptotic Feature Pyramid Network for Object Detection [16.86715579071991]
本稿では,非隣接レベルでの直接対話を支援する機能ピラミッドネットワーク(AFPN)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させ、融合プロセスに高レベル特徴を実現する。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-06-28T07:58:49Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - Centralized Feature Pyramid for Object Detection [53.501796194901964]
視覚的特徴ピラミッドは、広範囲のアプリケーションにおいて、有効性と効率の両方において、その優位性を示している。
本稿では,オブジェクト検出のためのOLO特徴ピラミッドを提案する。
論文 参考訳(メタデータ) (2022-10-05T08:32:54Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Adaptive Linear Span Network for Object Skeleton Detection [56.78705071830965]
本研究では,適応線形スパンネットワーク(AdaLSN)を提案する。
AdaLSNは、精度とレイテンシのトレードオフを著しく高めることで、その汎用性を裏付ける。
また、エッジ検出や道路抽出といったイメージ・ツー・マスクのタスクに適用可能であることも示している。
論文 参考訳(メタデータ) (2020-11-08T12:51:14Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。