論文の概要: AGSFCOS: Based on attention mechanism and Scale-Equalizing pyramid
network of object detection
- arxiv url: http://arxiv.org/abs/2105.09596v1
- Date: Thu, 20 May 2021 08:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 13:48:05.126996
- Title: AGSFCOS: Based on attention mechanism and Scale-Equalizing pyramid
network of object detection
- Title(参考訳): agsfcos:オブジェクト検出のための注意機構とスケール等化ピラミッドネットワークに基づく
- Authors: Li Wang, Wei Xiang, Ruhui Xue, Kaida Zou, Laili Zhu
- Abstract要約: 現在のCOCOデータセットの一般的な検出モデルと比較すると,精度はある程度向上している。
我々の最適モデルはResNet50の背景で39.5%のCOCO APが得られる。
- 参考スコア(独自算出の注目度): 10.824032219531095
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, the anchor-free object detection model has shown great potential
for accuracy and speed to exceed anchor-based object detection. Therefore, two
issues are mainly studied in this article: (1) How to let the backbone network
in the anchor-free object detection model learn feature extraction? (2) How to
make better use of the feature pyramid network? In order to solve the above
problems, Experiments show that our model has a certain improvement in accuracy
compared with the current popular detection models on the COCO dataset, the
designed attention mechanism module can capture contextual information well,
improve detection accuracy, and use sepc network to help balance abstract and
detailed information, and reduce the problem of semantic gap in the feature
pyramid network. Whether it is anchor-based network model YOLOv3, Faster RCNN,
or anchor-free network model Foveabox, FSAF, FCOS. Our optimal model can get
39.5% COCO AP under the background of ResNet50.
- Abstract(参考訳): 近年,アンカーフリー物体検出モデルでは,アンカーベース物体検出を超える精度と速度の可能性が示された。
そこで本論文では,(1)アンカーフリーオブジェクト検出モデルにおけるバックボーンネットワークを特徴抽出をどのように学習させるか,という課題を主に研究している。
(2) 特徴ピラミッドネットワークをどう活用するか?
以上の問題を解決するため,提案モデルでは,COCOデータセット上の一般的な検出モデルと比較して精度が向上し,設計した注目機構モジュールがコンテキスト情報を適切に把握し,検出精度を向上し,セックネットワークを用いて抽象的かつ詳細な情報のバランスを保ち,特徴ピラミッドネットワークにおける意味的ギャップの問題を軽減できることを示した。
アンカーベースネットワークモデル YOLOv3 や Faster RCNN,あるいはアンカーフリーネットワークモデル Foveabox, FSAF, FCOS などである。
我々の最適モデルはResNet50の背景で39.5%のCOCO APが得られる。
関連論文リスト
- LeYOLO, New Scalable and Efficient CNN Architecture for Object Detection [0.0]
FLOPに基づく効率的な物体検出のためのニューラルネットワークアーキテクチャの設計選択に着目する。
そこで本研究では,YOLOモデルの有効性を高めるために,いくつかの最適化手法を提案する。
本稿では、オブジェクト検出のための新しいスケーリングパラダイムと、LeYOLOと呼ばれるYOLO中心のモデルに寄与する。
論文 参考訳(メタデータ) (2024-06-20T12:08:24Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文 参考訳(メタデータ) (2023-01-10T16:22:04Z) - Part-Based Models Improve Adversarial Robustness [57.699029966800644]
人間の事前知識とエンドツーエンドの学習を組み合わせることで、ディープニューラルネットワークの堅牢性を向上させることができることを示す。
我々のモデルは、部分分割モデルと小さな分類器を組み合わせて、オブジェクトを同時に部品に分割するようにエンドツーエンドに訓練されている。
実験の結果,これらのモデルによりテクスチャバイアスが低減され,一般的な汚職に対する堅牢性が向上し,相関が急上昇することが示唆された。
論文 参考訳(メタデータ) (2022-09-15T15:41:47Z) - a novel attention-based network for fast salient object detection [14.246237737452105]
現在の有向物体検出ネットワークにおいて、最も一般的な方法はU字型構造を用いることである。
3つのコントリビューションを持つ新しい深層畳み込みネットワークアーキテクチャを提案する。
提案手法は, 精度を損なうことなく, 原サイズの1/3まで圧縮できることを示した。
論文 参考訳(メタデータ) (2021-12-20T12:30:20Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - An Attention Module for Convolutional Neural Networks [5.333582981327498]
本稿では,AW-畳み込みを開発することで,畳み込みニューラルネットワークのためのアテンションモジュールを提案する。
画像分類とオブジェクト検出タスクのための複数のデータセットの実験により,提案した注目モジュールの有効性が示された。
論文 参考訳(メタデータ) (2021-08-18T15:36:18Z) - Recalibration of Neural Networks for Point Cloud Analysis [3.7814216736076434]
3Dポイントクラウドのためのディープニューラルネットワーク上での再校正モジュールを導入する。
提案モジュールを3次元ポイントクラウド解析のための3つの最先端ネットワークに組み込むことで,提案モジュールのメリットと汎用性を実証する。
第2の実験では,アルツハイマー病の診断における再校正ブロックの利点について検討した。
論文 参考訳(メタデータ) (2020-11-25T17:14:34Z) - Zero Cost Improvements for General Object Detection Network [6.072666305426913]
2つのモジュールがコストゼロで検出精度を向上させるために提案されている。
パラメータの少ないマルチレベル特徴写像を効率的に融合するために,スケールアテンション機構を用いる。
実験の結果,2つのモジュールを持つネットワークはコストゼロで1.1 APと0.8 APを越えられることがわかった。
論文 参考訳(メタデータ) (2020-11-16T07:21:57Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z) - NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection [170.30694322460045]
我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
論文 参考訳(メタデータ) (2020-01-18T15:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。