Fugu-MT 論文翻訳(概要): A More Compact Object Detector Head Network with Feature Enhancement and Relational Reasoning

論文の概要: A More Compact Object Detector Head Network with Feature Enhancement and Relational Reasoning

arxiv url: http://arxiv.org/abs/2106.14475v1
Date: Mon, 28 Jun 2021 08:38:57 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-29 18:03:50.053391
Title: A More Compact Object Detector Head Network with Feature Enhancement and Relational Reasoning
Title（参考訳）: 特徴量拡張と関係推論を用いたよりコンパクトな物体検出ヘッドネットワーク
Authors: Wen chao Zhang, Chong Fu, Xiang shi Chang, Teng fei Zhao, Xiang Li, Chiu-Wing Sham
Abstract要約: よりコンパクトなオブジェクト検出器ヘッドネットワーク(CODH)を提案する。提案手法では,ヘッドネットワークのパラメータは最先端のカスケードR-CNNより0.6倍小さいが,COCOテストデブでは1.3%向上する。
参考スコア（独自算出の注目度）: 4.171249457570931
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modeling implicit feature interaction patterns is of significant importance to object detection tasks. However, in the two-stage detectors, due to the excessive use of hand-crafted components, it is very difficult to reason about the implicit relationship of the instance features. To tackle this problem, we analyze three different levels of feature interaction relationships, namely, the dependency relationship between the cropped local features and global features, the feature autocorrelation within the instance, and the cross-correlation relationship between the instances. To this end, we propose a more compact object detector head network (CODH), which can not only preserve global context information and condense the information density, but also allows instance-wise feature enhancement and relational reasoning in a larger matrix space. Without bells and whistles, our method can effectively improve the detection performance while significantly reducing the parameters of the model, e.g., with our method, the parameters of the head network is 0.6 times smaller than the state-of-the-art Cascade R-CNN, yet the performance boost is 1.3% on COCO test-dev. Without losing generality, we can also build a more lighter head network for other multi-stage detectors by assembling our method.
Abstract（参考訳）: 暗黙的特徴相互作用パターンのモデリングは、オブジェクト検出タスクにおいて重要である。しかし, 2段階検出器では手作り部品の過剰使用のため, インスタンスの特徴の暗黙的関係について考えることは極めて困難である。この問題に対処するために,トリミングされた局所特徴とグローバル特徴の依存関係関係,インスタンス内の特徴自己相関関係,インスタンス間の相互相関関係という,3つの異なる特徴間関係のレベルを分析した。この目的のために,よりコンパクトなオブジェクト検出ヘッドネットワーク(codh)を提案する。グローバルコンテキスト情報を保存し,情報密度を凝縮するだけでなく,大規模マトリックス空間におけるインスタンス間特徴量拡張と関係推論を可能にする。ベルとホイッスルがなければ,本手法はモデルのパラメータを著しく削減しながら検出性能を効果的に向上させることができる。例えば,本手法では,ヘッドネットワークのパラメータは最先端のカスケードR-CNNの0.6倍小さいが,COCOテストデブでは1.3%向上する。一般性を失うことなく、我々は他の多段検出器のためのより軽量なヘッドネットワークを構築することができる。

関連論文リスト

MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.0]
本稿では、3つのキーコンポーネントを統合したMSCA-Netという新しいネットワークアーキテクチャを提案する。 MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。 PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
論文参考訳（メタデータ） (2025-03-21T14:42:31Z)
Efficient Oriented Object Detection with Enhanced Small Object Recognition in Aerial Images [2.9138705529771123]
本稿では,オブジェクト指向物体検出タスクに適したYOLOv8モデルを新たに拡張する。本モデルでは,ASFP(Adaptive Scale Feature Pyramid)モジュールと,P2層の詳細を利用したウェーブレット変換に基づくC2fモジュールを特徴とする。我々のアプローチは233万のパラメータを持つDecoupleNetよりも効率的なアーキテクチャ設計を提供し、検出精度を維持しています。
論文参考訳（メタデータ） (2024-12-17T05:45:48Z)
Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。 KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。 RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文参考訳（メタデータ） (2024-09-09T13:56:22Z)
Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。 CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文参考訳（メタデータ） (2023-08-18T13:13:09Z)
Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文参考訳（メタデータ） (2023-07-01T13:53:14Z)
Rethinking the Detection Head Configuration for Traffic Object Detection [11.526701794026641]
本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
論文参考訳（メタデータ） (2022-10-08T02:23:57Z)
Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。 Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-08-18T03:48:58Z)
DisARM: Displacement Aware Relation Module for 3D Detection [38.4380420322491]
Displacement Aware Relation Module (DisARM)は、ポイントクラウドシーンにおける3Dオブジェクト検出の性能を向上させるニューラルネットワークモジュールである。アンカーを見つけるために,まず,対象性を考慮したサンプリング手法を用いて予備的な関係アンカーモジュールを実行する。この軽量なリレーショナルモジュールは、最先端検出器に差し込む際にオブジェクトインスタンス検出の精度を著しく向上させる。
論文参考訳（メタデータ） (2022-03-02T14:49:55Z)
EPNet++: Cascade Bi-directional Fusion for Multi-Modal 3D Object Detection [56.03081616213012]
本稿では,新しいCasscade Bi-directional Fusion(CB-Fusion)モジュールを導入することで,マルチモーダル3Dオブジェクト検出のためのEPNet++を提案する。提案したCB-Fusionモジュールは、カスケード双方向相互作用融合方式で画像特徴と点特徴の豊富な意味情報を高める。 KITTI、JRDB、SUN-RGBDデータセットの実験結果は、最先端の手法よりもEPNet++の方が優れていることを示している。
論文参考訳（メタデータ） (2021-12-21T10:48:34Z)
Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文参考訳（メタデータ） (2021-12-13T14:37:20Z)
LC3Net: Ladder context correlation complementary network for salient object detection [0.32116198597240836]
我々は,新しいラグコンテキスト相関補完ネットワーク (LC3Net) を提案する。 FCBはフィルタリング可能な畳み込みブロックであり、初期特徴の多様性に関する情報の自動収集を支援する。 DCMは、異なるレベルの特徴の密集を促進するための密接なクロスモジュールである。 BCDは双方向圧縮デコーダであり、マルチスケール機能の段階的縮小を支援する。
論文参考訳（メタデータ） (2021-10-21T03:12:32Z)
Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。 PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文参考訳（メタデータ） (2020-07-05T18:54:10Z)
Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文参考訳（メタデータ） (2020-03-09T17:05:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。