論文の概要: DetectoRS: Detecting Objects with Recursive Feature Pyramid and
Switchable Atrous Convolution
- arxiv url: http://arxiv.org/abs/2006.02334v2
- Date: Mon, 30 Nov 2020 16:06:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 18:12:04.930523
- Title: DetectoRS: Detecting Objects with Recursive Feature Pyramid and
Switchable Atrous Convolution
- Title(参考訳): DetectoRS: 再帰的特徴ピラミッドと切り替え可能なアトラス畳み込みによるオブジェクトの検出
- Authors: Siyuan Qiao, Liang-Chieh Chen, Alan Yuille
- Abstract要約: 物体検出のためのバックボーン設計において,2回検討・検討する機構について検討する。
マクロレベルでは、Feature Pyramid Networksから追加のフィードバック接続を組み込んだRecursive Feature Pyramidを提案する。
マイクロレベルでは、異なるアラスレートで特徴を包含し、結果を収集するスイッチブル・アラス・コンボリューションを提案する。
- 参考スコア(独自算出の注目度): 27.67084901207291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many modern object detectors demonstrate outstanding performances by using
the mechanism of looking and thinking twice. In this paper, we explore this
mechanism in the backbone design for object detection. At the macro level, we
propose Recursive Feature Pyramid, which incorporates extra feedback
connections from Feature Pyramid Networks into the bottom-up backbone layers.
At the micro level, we propose Switchable Atrous Convolution, which convolves
the features with different atrous rates and gathers the results using switch
functions. Combining them results in DetectoRS, which significantly improves
the performances of object detection. On COCO test-dev, DetectoRS achieves
state-of-the-art 55.7% box AP for object detection, 48.5% mask AP for instance
segmentation, and 50.0% PQ for panoptic segmentation. The code is made publicly
available.
- Abstract(参考訳): 多くの近代的な物体検出器は、2回見て考えるメカニズムを用いて優れた性能を示した。
本稿では,物体検出のためのバックボーン設計において,この機構を考察する。
マクロレベルでは、Feature Pyramid Networksからボトムアップバックボーン層への追加のフィードバック接続を組み込んだRecursive Feature Pyramidを提案する。
マイクロレベルでは、機能を異なるatrousレートで結合し、switch関数を用いて結果を収集するswitchable atrous convolutionを提案する。
これらを組み合わせることで、オブジェクト検出のパフォーマンスが大幅に向上するDetectoRSが実現される。
COCOテストデブでは、オブジェクト検出のための最先端55.7%のボックスAP、インスタンスセグメンテーションのための48.5%のマスクAP、パン光学セグメンテーションのための50.0%のPQを達成する。
コードは公開されています。
関連論文リスト
- DetToolChain: A New Prompting Paradigm to Unleash Detection Ability of MLLM [81.75988648572347]
DetToolChainはマルチモーダル大言語モデル(MLLM)のゼロショットオブジェクト検出能力を解き放つ新しいパラダイムである。
提案手法は,高精度検出にヒントを得た検出プロンプトツールキットと,これらのプロンプトを実装するための新しいChain-of-Thoughtから構成される。
DetToolChainを用いたGPT-4Vは,オープン語彙検出のための新しいクラスセットにおいて,最先端のオブジェクト検出器を+21.5%AP50で改善することを示す。
論文 参考訳(メタデータ) (2024-03-19T06:54:33Z) - Feature Shrinkage Pyramid for Camouflaged Object Detection with
Transformers [34.42710399235461]
視覚変換器は、最近、擬似的オブジェクト検出において、強いグローバルなコンテキストモデリング能力を示した。
ローカリティモデリングの効率の低下とデコーダの機能集約の不足という2つの大きな制限に悩まされている。
本研究では, 局所性向上した隣接する変圧器の特徴を階層的に復号化することを目的とした, 変圧器をベースとしたFSPNet(Feature Shrinkage Pyramid Network)を提案する。
論文 参考訳(メタデータ) (2023-03-26T20:50:58Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - Towards Accurate Pixel-wise Object Tracking by Attention Retrieval [50.06436600343181]
本稿では,バックボーンの特徴に対するソフト空間制約を実現するために,アテンション検索ネットワーク(ARN)を提案する。
私たちは40fpsで動作しながら、最近のピクセルワイドオブジェクトトラッキングベンチマークであるVOT 2020に最先端のベンチマークを新たに設定しました。
論文 参考訳(メタデータ) (2020-08-06T16:25:23Z) - Segment as Points for Efficient Online Multi-Object Tracking and
Segmentation [66.03023110058464]
本稿では,コンパクトな画像表現を非秩序な2次元点クラウド表現に変換することで,セグメントに基づくインスタンス埋め込みの学習に有効な方法を提案する。
本手法は,画像ではなく,ランダムに選択された点から識別インスタンスの埋め込みを学習する,新たなトラッキング・バイ・ポイントのパラダイムを生成する。
PointTrackという名前のオンラインMOTSフレームワークは、最先端のすべてのメソッドを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-07-03T08:29:35Z) - Hit-Detector: Hierarchical Trinity Architecture Search for Object
Detection [67.84976857449263]
本稿では,オブジェクト検出器のすべてのコンポーネントに対して,効率的なアーキテクチャを同時に発見するための階層型三元探索フレームワークを提案する。
そこで我々は,各コンポーネントのエンドツーエンド検索を効率的に行うために,異なるコンポーネントに対して異なるサブ検索空間を自動的にスクリーニングする新しい手法を採用した。
検索したアーキテクチャ、すなわちhit-Detectorは、27Mパラメータを持つCOCOミニバルセット上で41.4%のmAPを達成する。
論文 参考訳(メタデータ) (2020-03-26T10:20:52Z) - Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder [5.371825910267909]
異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
論文 参考訳(メタデータ) (2020-01-04T08:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。