論文の概要: Trident Pyramid Networks: The importance of processing at the feature
pyramid level for better object detection
- arxiv url: http://arxiv.org/abs/2110.04004v1
- Date: Fri, 8 Oct 2021 09:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-11 15:07:00.485573
- Title: Trident Pyramid Networks: The importance of processing at the feature
pyramid level for better object detection
- Title(参考訳): trident pyramid networks: 優れたオブジェクト検出のための機能ピラミッドレベルでの処理の重要性
- Authors: C\'edric Picron, Tinne Tuytelaars
- Abstract要約: 我々はTrident Pyramid Network (TPN)と呼ばれる新しいコアアーキテクチャを提案する。
TPNはより深い設計を可能にし、コミュニケーションベースの処理と自己処理のバランスを改善する。
TPNコアをオブジェクト検出ベンチマークで使用した場合,BifPNベースラインを1.5 APで上回り,一貫した改善が見られた。
- 参考スコア(独自算出の注目度): 50.008529403150206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature pyramids have become ubiquitous in multi-scale computer vision tasks
such as object detection. Based on their importance, we divide a computer
vision network into three parts: a backbone (generating a feature pyramid), a
core (refining the feature pyramid) and a head (generating the final output).
Most existing networks operating on feature pyramids, named cores, are shallow
and mostly focus on communication-based processing in the form of top-down and
bottom-up operations. We present a new core architecture called Trident Pyramid
Network (TPN), that allows for a deeper design and for a better balance between
communication-based processing and self-processing. We show consistent
improvements when using our TPN core on the COCO object detection benchmark,
outperforming the popular BiFPN baseline by 1.5 AP. Additionally, we
empirically show that it is more beneficial to put additional computation into
the TPN core, rather than into the backbone, by outperforming a ResNet-101+FPN
baseline with our ResNet-50+TPN network by 1.7 AP, while operating under
similar computation budgets. This emphasizes the importance of performing
computation at the feature pyramid level in modern-day object detection
systems. Code will be released.
- Abstract(参考訳): 特徴ピラミッドは、オブジェクト検出などのマルチスケールコンピュータビジョンタスクにおいてユビキタスになっている。
その重要性に基づいて、コンピュータビジョンネットワークを3つの部分に分割する。バックボーン(フィーチャーピラミッドを生成する)、コア(フィーチャーピラミッドを改良)、ヘッド(最終的なアウトプットを生成する)である。
コアと呼ばれる機能ピラミッドで運用されている既存のネットワークのほとんどは浅く、トップダウンとボトムアップという形で通信ベースの処理に重点を置いている。
本稿では,Trident Pyramid Network (TPN) と呼ばれる新しいコアアーキテクチャを提案する。
我々は,COCOオブジェクト検出ベンチマークでTPNコアを使用することで,人気の高いBiFPNベースラインを1.5 APで上回り,一貫した改善を示す。
さらに、我々のResNet-50+TPNネットワークで1.7 APでResNet-101+FPNベースラインを上回り、同様の計算予算の下で運用することで、TPNコアにさらなる計算を加える方が有益であることを実証的に示す。
これは、現代のオブジェクト検出システムにおいて、特徴ピラミッドレベルで計算を実行することの重要性を強調している。
コードはリリースされる。
関連論文リスト
- Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文 参考訳(メタデータ) (2023-12-18T18:16:30Z) - RCNet: Reverse Feature Pyramid and Cross-scale Shift Network for Object
Detection [10.847953426161924]
本稿では,RevFP(Reverse Feature Pyramid)とCSN(Cross-scale Shift Network)で構成されるRCNetを提案する。
RevFPは、局所的な双方向特徴融合を利用して、双方向ピラミッド推論パイプラインを簡素化する。
CSNは、隣接レベルと非隣接レベルの両方に直接表現を伝播し、より相関性の高いマルチスケール機能を実現する。
論文 参考訳(メタデータ) (2021-10-23T04:00:25Z) - Siamese Transformer Pyramid Networks for Real-Time UAV Tracking [3.0969191504482243]
本稿では,CNNとTransformerアーキテクチャの両方の利点を継承するSiamTPN(Siamese Transformer Pyramid Network)を紹介する。
航空機と一般的な追跡ベンチマークの両方の実験は、高速で動作しながら競争的な結果を得る。
我々の最速の可変トラッカーは、1つのCPUコアで30Hz以上で動作し、LaSOTデータセットで58.1%のAUCスコアを得る。
論文 参考訳(メタデータ) (2021-10-17T13:48:31Z) - GraphFPN: Graph Feature Pyramid Network for Object Detection [44.481481251032264]
本稿では,そのトポロジ構造を固有画像構造に適応させることのできるグラフ特徴ピラミッドネットワークを提案する。
提案したグラフ特徴ピラミッドネットワークは,畳み込み特徴ピラミッドネットワークからマルチスケール特徴を拡張できる。
我々は、オブジェクト検出タスクにおいて、より高速なR-CNNアルゴリズムに統合することで、グラフ特徴ピラミッドネットワークを評価する。
論文 参考訳(メタデータ) (2021-08-02T01:19:38Z) - P2T: Pyramid Pooling Transformer for Scene Understanding [62.41912463252468]
私たちはP2Tと呼ばれる下流タスク指向のトランスネットワークを構築します。
プールベースのMHSAを組み込んで、P2Tと呼ばれる下流タスク指向のトランスネットワークを構築しました。
論文 参考訳(メタデータ) (2021-06-22T18:28:52Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - Implicit Feature Pyramid Network for Object Detection [22.530998243247154]
物体検出のための暗黙的特徴ピラミッドネットワーク(i-FPN)を提案する。
本稿では,深平衡モデル(DEQ)で最近導入された暗黙関数を用いてFPNの変換をモデル化する。
MSデータセットによる実験結果から,i-FPNはベースライン検出器と比較して検出性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-12-25T11:30:27Z) - Hierarchical Neural Architecture Search for Deep Stereo Matching [131.94481111956853]
本稿では, ディープステレオマッチングのための最初のエンドツーエンド階層型NASフレームワークを提案する。
我々のフレームワークは、タスク固有の人間の知識をニューラルアーキテクチャ検索フレームワークに組み込んでいる。
KITTI stereo 2012、2015、Middleburyベンチマークで1位、SceneFlowデータセットで1位にランクインしている。
論文 参考訳(メタデータ) (2020-10-26T11:57:37Z) - ResFPN: Residual Skip Connections in Multi-Resolution Feature Pyramid
Networks for Accurate Dense Pixel Matching [10.303618438296981]
特徴ピラミッドネットワーク(FPN)は,CNNに基づく密マッチングタスクに適した特徴抽出器であることが証明されている。
複数の残差スキップ接続を有する多分解能特徴ピラミッドネットワークであるResFPNを提案する。
アブレーション実験では,FPNよりも明らかに高い精度で新しいアーキテクチャの有効性を実証した。
論文 参考訳(メタデータ) (2020-06-22T13:31:31Z) - Feature Pyramid Grids [140.11116687047058]
本稿では,深い多経路特徴ピラミッドであるFeature Pyramid Grids (FPG)を提案する。
FPGは、同様の計算コストで性能を大幅に向上させることで、シングルパスの特徴ピラミッドネットワークを改善することができる。
論文 参考訳(メタデータ) (2020-04-07T17:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。