論文の概要: Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder
- arxiv url: http://arxiv.org/abs/2001.01057v2
- Date: Tue, 29 Sep 2020 02:28:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 12:39:00.524575
- Title: Pixel-Semantic Revise of Position Learning A One-Stage Object Detector
with A Shared Encoder-Decoder
- Title(参考訳): 共有エンコーダ・デコーダを用いた一段階物体検出器の位置学習の画素論的修正
- Authors: Qian Li, Nan Guo, Xiaochun Ye, Dongrui Fan, and Zhimin Tang
- Abstract要約: 異なる手法がオブジェクトを適応的に検出することを分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。
この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
- 参考スコア(独自算出の注目度): 5.371825910267909
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, many methods have been proposed for object detection. They cannot
detect objects by semantic features, adaptively. In this work, according to
channel and spatial attention mechanisms, we mainly analyze that different
methods detect objects adaptively. Some state-of-the-art detectors combine
different feature pyramids with many mechanisms to enhance multi-level semantic
information. However, they require more cost. This work addresses that by an
anchor-free detector with shared encoder-decoder with attention mechanism,
extracting shared features. We consider features of different levels from
backbone (e.g., ResNet-50) as the basis features. Then, we feed the features
into a simple module, followed by a detector header to detect objects.
Meantime, we use the semantic features to revise geometric locations, and the
detector is a pixel-semantic revising of position. More importantly, this work
analyzes the impact of different pooling strategies (e.g., mean, maximum or
minimum) on multi-scale objects, and finds the minimum pooling improve
detection performance on small objects better. Compared with state-of-the-art
MNC based on ResNet-101 for the standard MSCOCO 2014 baseline, our method
improves detection AP of 3.8%.
- Abstract(参考訳): 近年,物体検出のための手法が多数提案されている。
意味的特徴によって、適応的にオブジェクトを検出できない。
本研究は, チャネルや空間的注意機構に基づいて, 物体を適応的に検出する手法を主に分析する。
いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせる。
しかし、よりコストがかかる。
この研究は、注意機構を持つ共有エンコーダデコーダを備えたアンカーフリー検出器によって、共有特徴を抽出する。
バックボーン(ResNet-50など)から異なるレベルの機能を基本機能として検討する。
そして、これらの特徴を単純なモジュールに供給し、続いて検出器ヘッダーでオブジェクトを検出します。
意味的特徴を幾何学的位置の修正に利用し、検出器は位置のピクセル・セマンティックな修正である。
さらに重要なことは、この研究がマルチスケールオブジェクトに対する様々なプーリング戦略(平均値または最小値)の影響を分析し、最小プールによって小さなオブジェクトの検出性能が向上することである。
標準 MSCOCO 2014 ベースラインの ResNet-101 に基づく最先端 MNC と比較して,本手法では検出精度が3.8%向上した。
関連論文リスト
- Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - Skipped Feature Pyramid Network with Grid Anchor for Object Detection [6.99246486061412]
特徴ピラミッドの各レベルにおいてより強力な意味論を得るために,スキップ接続を提案する。
提案手法では,各レベルが一定スケールの物体を検知する責任を負うことがより合理的である。
論文 参考訳(メタデータ) (2023-10-22T23:27:05Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [4.392212820170972]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - Rethinking the Detection Head Configuration for Traffic Object Detection [11.526701794026641]
本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-08T02:23:57Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - MultiResolution Attention Extractor for Small Object Detection [40.74232149130456]
小さい物体は解像度が低く、小さいため検出が難しい。
人間の視覚の「注意」メカニズムにインスパイアされ、我々は2つの特徴抽出手法を利用して、小さな物体の最も有用な情報をマイニングする。
論文 参考訳(メタデータ) (2020-06-10T16:47:56Z) - Hit-Detector: Hierarchical Trinity Architecture Search for Object
Detection [67.84976857449263]
本稿では,オブジェクト検出器のすべてのコンポーネントに対して,効率的なアーキテクチャを同時に発見するための階層型三元探索フレームワークを提案する。
そこで我々は,各コンポーネントのエンドツーエンド検索を効率的に行うために,異なるコンポーネントに対して異なるサブ検索空間を自動的にスクリーニングする新しい手法を採用した。
検索したアーキテクチャ、すなわちhit-Detectorは、27Mパラメータを持つCOCOミニバルセット上で41.4%のmAPを達成する。
論文 参考訳(メタデータ) (2020-03-26T10:20:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。