論文の概要: Skipped Feature Pyramid Network with Grid Anchor for Object Detection
- arxiv url: http://arxiv.org/abs/2310.14453v1
- Date: Sun, 22 Oct 2023 23:27:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 23:43:22.621032
- Title: Skipped Feature Pyramid Network with Grid Anchor for Object Detection
- Title(参考訳): 物体検出のためのグリッドアンカー付きスクリッピング特徴ピラミッドネットワーク
- Authors: Li Pengfei, Wei Wei, Yan Yu, Zhu Rong, Zhou Liguo
- Abstract要約: 特徴ピラミッドの各レベルにおいてより強力な意味論を得るために,スキップ接続を提案する。
提案手法では,各レベルが一定スケールの物体を検知する責任を負うことがより合理的である。
- 参考スコア(独自算出の注目度): 6.99246486061412
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: CNN-based object detection methods have achieved significant progress in
recent years. The classic structures of CNNs produce pyramid-like feature maps
due to the pooling or other re-scale operations. The feature maps in different
levels of the feature pyramid are used to detect objects with different scales.
For more accurate object detection, the highest-level feature, which has the
lowest resolution and contains the strongest semantics, is up-scaled and
connected with the lower-level features to enhance the semantics in the
lower-level features. However, the classic mode of feature connection combines
the feature of lower-level with all the features above it, which may result in
semantics degradation. In this paper, we propose a skipped connection to obtain
stronger semantics at each level of the feature pyramid. In our method, the
lower-level feature only connects with the feature at the highest level, making
it more reasonable that each level is responsible for detecting objects with
fixed scales. In addition, we simplify the generation of anchor for bounding
box regression, which can further improve the accuracy of object detection. The
experiments on the MS COCO and Wider Face demonstrate that our method
outperforms the state-of-the-art methods.
- Abstract(参考訳): 近年,CNNに基づく物体検出法は大きな進歩を遂げている。
CNNの古典的な構造は、プールや他の再スケール操作のためにピラミッドのような特徴マップを生成する。
特徴ピラミッドの異なるレベルの特徴マップは、異なるスケールのオブジェクトを検出するために使用される。
より正確なオブジェクト検出では、最も解像度が低く、最も強いセマンティクスを含む最高レベルの機能は、上位にスケールされ、下位レベルの機能と接続され、下位レベルの機能におけるセマンティクスを強化する。
しかし、古典的な機能接続モードは、低レベルの機能と上のすべての機能を組み合わせることで、セマンティクスの劣化をもたらす可能性がある。
本稿では,特徴ピラミッドの各レベルにおいて,より強固なセマンティクスを得るためのスキップ接続を提案する。
提案手法では,低レベル機能は高レベルな特徴とのみ接続するので,各レベルが固定スケールの物体を検出する責任を負うのがより合理的である。
さらに,境界ボックス回帰のためのアンカー生成を単純化し,オブジェクト検出の精度をさらに向上させる。
MS COCOとWider Faceの実験は、我々の手法が最先端の手法よりも優れていることを示した。
関連論文リスト
- AFPN: Asymptotic Feature Pyramid Network for Object Detection [16.86715579071991]
本稿では,非隣接レベルでの直接対話を支援する機能ピラミッドネットワーク(AFPN)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させ、融合プロセスに高レベル特徴を実現する。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-06-28T07:58:49Z) - Multistep feature aggregation framework for salient object detection [0.0]
本稿では,有能な物体検出のための多段階特徴集約フレームワークを提案する。
Diverse Reception (DR) モジュール、Multiscale Interaction (MSI) モジュール、Feature Enhancement (FE) モジュールの3つのモジュールで構成されている。
6つのベンチマークデータセットの実験結果は、MSFAが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2022-11-12T16:13:16Z) - Improving Semantic Segmentation in Transformers using Hierarchical
Inter-Level Attention [68.7861229363712]
Hierarchical Inter-Level Attention (HILA)は、異なるレベルの機能間のボトムアップとトップダウン更新をキャプチャするアテンションベースの手法である。
HILAは階層型ヴィジュアルトランスフォーマーアーキテクチャを拡張し、上位と下位の機能間の局所的な接続をバックボーンエンコーダに追加する。
より少ないパラメータとFLOPSを用いたセマンティックセグメンテーションでは,精度が顕著に向上した。
論文 参考訳(メタデータ) (2022-07-05T15:47:31Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Fine-Grained Dynamic Head for Object Detection [68.70628757217939]
本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-07T08:16:32Z) - Adaptive Linear Span Network for Object Skeleton Detection [56.78705071830965]
本研究では,適応線形スパンネットワーク(AdaLSN)を提案する。
AdaLSNは、精度とレイテンシのトレードオフを著しく高めることで、その汎用性を裏付ける。
また、エッジ検出や道路抽出といったイメージ・ツー・マスクのタスクに適用可能であることも示している。
論文 参考訳(メタデータ) (2020-11-08T12:51:14Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文 参考訳(メタデータ) (2020-01-04T08:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。