論文の概要: A More Compact Object Detector Head Network with Feature Enhancement and
Relational Reasoning
- arxiv url: http://arxiv.org/abs/2106.14475v1
- Date: Mon, 28 Jun 2021 08:38:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:03:50.053391
- Title: A More Compact Object Detector Head Network with Feature Enhancement and
Relational Reasoning
- Title(参考訳): 特徴量拡張と関係推論を用いたよりコンパクトな物体検出ヘッドネットワーク
- Authors: Wen chao Zhang, Chong Fu, Xiang shi Chang, Teng fei Zhao, Xiang Li,
Chiu-Wing Sham
- Abstract要約: よりコンパクトなオブジェクト検出器ヘッドネットワーク(CODH)を提案する。
提案手法では,ヘッドネットワークのパラメータは最先端のカスケードR-CNNより0.6倍小さいが,COCOテストデブでは1.3%向上する。
- 参考スコア(独自算出の注目度): 4.171249457570931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling implicit feature interaction patterns is of significant importance
to object detection tasks. However, in the two-stage detectors, due to the
excessive use of hand-crafted components, it is very difficult to reason about
the implicit relationship of the instance features. To tackle this problem, we
analyze three different levels of feature interaction relationships, namely,
the dependency relationship between the cropped local features and global
features, the feature autocorrelation within the instance, and the
cross-correlation relationship between the instances. To this end, we propose a
more compact object detector head network (CODH), which can not only preserve
global context information and condense the information density, but also
allows instance-wise feature enhancement and relational reasoning in a larger
matrix space. Without bells and whistles, our method can effectively improve
the detection performance while significantly reducing the parameters of the
model, e.g., with our method, the parameters of the head network is 0.6 times
smaller than the state-of-the-art Cascade R-CNN, yet the performance boost is
1.3% on COCO test-dev. Without losing generality, we can also build a more
lighter head network for other multi-stage detectors by assembling our method.
- Abstract(参考訳): 暗黙的特徴相互作用パターンのモデリングは、オブジェクト検出タスクにおいて重要である。
しかし, 2段階検出器では手作り部品の過剰使用のため, インスタンスの特徴の暗黙的関係について考えることは極めて困難である。
この問題に対処するために,トリミングされた局所特徴とグローバル特徴の依存関係関係,インスタンス内の特徴自己相関関係,インスタンス間の相互相関関係という,3つの異なる特徴間関係のレベルを分析した。
この目的のために,よりコンパクトなオブジェクト検出ヘッドネットワーク(codh)を提案する。グローバルコンテキスト情報を保存し,情報密度を凝縮するだけでなく,大規模マトリックス空間におけるインスタンス間特徴量拡張と関係推論を可能にする。
ベルとホイッスルがなければ,本手法はモデルのパラメータを著しく削減しながら検出性能を効果的に向上させることができる。例えば,本手法では,ヘッドネットワークのパラメータは最先端のカスケードR-CNNの0.6倍小さいが,COCOテストデブでは1.3%向上する。
一般性を失うことなく、我々は他の多段検出器のためのより軽量なヘッドネットワークを構築することができる。
関連論文リスト
- Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Rethinking the Detection Head Configuration for Traffic Object Detection [11.526701794026641]
本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-08T02:23:57Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z) - DisARM: Displacement Aware Relation Module for 3D Detection [38.4380420322491]
Displacement Aware Relation Module (DisARM)は、ポイントクラウドシーンにおける3Dオブジェクト検出の性能を向上させるニューラルネットワークモジュールである。
アンカーを見つけるために,まず,対象性を考慮したサンプリング手法を用いて予備的な関係アンカーモジュールを実行する。
この軽量なリレーショナルモジュールは、最先端検出器に差し込む際にオブジェクトインスタンス検出の精度を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-02T14:49:55Z) - EPNet++: Cascade Bi-directional Fusion for Multi-Modal 3D Object
Detection [56.03081616213012]
本稿では,新しいCasscade Bi-directional Fusion(CB-Fusion)モジュールを導入することで,マルチモーダル3Dオブジェクト検出のためのEPNet++を提案する。
提案したCB-Fusionモジュールは、カスケード双方向相互作用融合方式で画像特徴と点特徴の豊富な意味情報を高める。
KITTI、JRDB、SUN-RGBDデータセットの実験結果は、最先端の手法よりもEPNet++の方が優れていることを示している。
論文 参考訳(メタデータ) (2021-12-21T10:48:34Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - LC3Net: Ladder context correlation complementary network for salient
object detection [0.32116198597240836]
我々は,新しいラグコンテキスト相関補完ネットワーク (LC3Net) を提案する。
FCBはフィルタリング可能な畳み込みブロックであり、初期特徴の多様性に関する情報の自動収集を支援する。
DCMは、異なるレベルの特徴の密集を促進するための密接なクロスモジュールである。
BCDは双方向圧縮デコーダであり、マルチスケール機能の段階的縮小を支援する。
論文 参考訳(メタデータ) (2021-10-21T03:12:32Z) - Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。
PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文 参考訳(メタデータ) (2020-07-05T18:54:10Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。