論文の概要: You Should Look at All Objects
- arxiv url: http://arxiv.org/abs/2207.07889v1
- Date: Sat, 16 Jul 2022 09:59:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 07:33:00.596189
- Title: You Should Look at All Objects
- Title(参考訳): すべてのオブジェクトを見るべきです
- Authors: Zhenchao Jin, Dongdong Yu, Luchuan Song, Zehuan Yuan, Lequan Yu
- Abstract要約: 本稿では,検出フレームワークにおけるFPNを再検討し,最適化の観点からFPNの成功の性質を明らかにする。
大規模物体の劣化特性は、FPNの統合後の不適切なバックプロパゲーションパスの発生によるものである。
バックボーンの各レベルがFPNベースの検出フレームワークの全オブジェクトを見ることができるように、2つの実行可能な戦略が提案されている。
- 参考スコア(独自算出の注目度): 28.862053913000384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature pyramid network (FPN) is one of the key components for object
detectors. However, there is a long-standing puzzle for researchers that the
detection performance of large-scale objects are usually suppressed after
introducing FPN. To this end, this paper first revisits FPN in the detection
framework and reveals the nature of the success of FPN from the perspective of
optimization. Then, we point out that the degraded performance of large-scale
objects is due to the arising of improper back-propagation paths after
integrating FPN. It makes each level of the backbone network only has the
ability to look at the objects within a certain scale range. Based on these
analysis, two feasible strategies are proposed to enable each level of the
backbone to look at all objects in the FPN-based detection frameworks.
Specifically, one is to introduce auxiliary objective functions to make each
backbone level directly receive the back-propagation signals of various-scale
objects during training. The other is to construct the feature pyramid in a
more reasonable way to avoid the irrational back-propagation paths. Extensive
experiments on the COCO benchmark validate the soundness of our analysis and
the effectiveness of our methods. Without bells and whistles, we demonstrate
that our method achieves solid improvements (more than 2%) on various detection
frameworks: one-stage, two-stage, anchor-based, anchor-free and
transformer-based detectors.
- Abstract(参考訳): 特徴ピラミッドネットワーク(FPN)は、物体検出器の鍵となるコンポーネントの1つである。
しかし、大規模物体の検出性能は通常、fpnの導入後に抑制されるという長年の謎がある。
そこで本研究では,まずFPNを検出フレームワークで再検討し,最適化の観点からFPNの成功の性質を明らかにする。
そこで我々は,FPN統合後の不適切なバックプロパゲーションパスの発生による大規模物体の劣化特性を指摘した。
バックボーンネットワークの各レベルは、特定のスケール範囲内のオブジェクトのみを見ることができる。
これらの分析に基づいて、fpnベースの検出フレームワークのすべてのオブジェクトをバックボーンの各レベルで見ることができるようにするための2つの実現可能な戦略が提案されている。
具体的には、トレーニング中に各バックボーンレベルに各種物体のバックプロパゲーション信号を直接受信させる補助的目的関数を導入する。
もうひとつは、不合理なバックプロパゲーションパスを避けるために、より合理的な方法でフィーチャーピラミッドを構築することです。
COCOベンチマークの広範囲な実験により, 分析の健全性と手法の有効性が検証された。
ベルとホイッスルがなければ,本手法は1段,2段,アンカーベース,アンカーフリー,変圧器ベース検出器など,様々な検出フレームワークにおいて確固たる改善(2%以上)を達成できることを示す。
関連論文リスト
- Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - AFPN: Asymptotic Feature Pyramid Network for Object Detection [16.86715579071991]
本稿では,非隣接レベルでの直接対話を支援する機能ピラミッドネットワーク(AFPN)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させ、融合プロセスに高レベル特徴を実現する。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-06-28T07:58:49Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - SFPN: Synthetic FPN for Object Detection [6.117917355232904]
本稿では, 軽量CNNバックホンの精度を高めるため, SFPN (Synthetic Fusion Pyramid Network) Arichtectureを提案する。
SFPNアーキテクチャは、大きなバックボーンVGG16、ResNet50、またはAPスコアに基づくMobilenetV2のような軽量のバックボーンよりも優れていた。
論文 参考訳(メタデータ) (2022-03-04T17:19:50Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Double-Dot Network for Antipodal Grasp Detection [20.21384585441404]
本稿では,Double-Dot Network (DD-Net) という,対足足歩行検出のための新しい深層学習手法を提案する。
これは、経験的にプリセットされたアンカーに依存しない最近のアンカーフリーなオブジェクト検出フレームワークに従っている。
このような指先をローカライズするために効果的なCNNアーキテクチャを導入し、改良のための補助センターの助けを借りて、把握候補を正確かつ堅牢に推測する。
論文 参考訳(メタデータ) (2021-08-03T14:21:17Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。