論文の概要: NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection
- arxiv url: http://arxiv.org/abs/2001.06690v1
- Date: Sat, 18 Jan 2020 15:21:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 05:21:39.828434
- Title: NETNet: Neighbor Erasing and Transferring Network for Better Single Shot
Object Detection
- Title(参考訳): netnet: シングルショットオブジェクト検出を改善するための隣の消去・転送ネットワーク
- Authors: Yazhao Li, Yanwei Pang, Jianbing Shen, Jiale Cao, Ling Shao
- Abstract要約: 我々は、ピラミッドの特徴を再設定し、スケールアウェアな特徴を探索する新しいNeighbor Erasing and Transferring(NET)メカニズムを提案する。
NETNetと呼ばれるシングルショットネットワークは、スケールアウェアなオブジェクト検出のために構築されている。
- 参考スコア(独自算出の注目度): 170.30694322460045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the advantages of real-time detection and improved performance,
single-shot detectors have gained great attention recently. To solve the
complex scale variations, single-shot detectors make scale-aware predictions
based on multiple pyramid layers. However, the features in the pyramid are not
scale-aware enough, which limits the detection performance. Two common problems
in single-shot detectors caused by object scale variations can be observed: (1)
small objects are easily missed; (2) the salient part of a large object is
sometimes detected as an object. With this observation, we propose a new
Neighbor Erasing and Transferring (NET) mechanism to reconfigure the pyramid
features and explore scale-aware features. In NET, a Neighbor Erasing Module
(NEM) is designed to erase the salient features of large objects and emphasize
the features of small objects in shallow layers. A Neighbor Transferring Module
(NTM) is introduced to transfer the erased features and highlight large objects
in deep layers. With this mechanism, a single-shot network called NETNet is
constructed for scale-aware object detection. In addition, we propose to
aggregate nearest neighboring pyramid features to enhance our NET. NETNet
achieves 38.5% AP at a speed of 27 FPS and 32.0% AP at a speed of 55 FPS on MS
COCO dataset. As a result, NETNet achieves a better trade-off for real-time and
accurate object detection.
- Abstract(参考訳): リアルタイム検出の利点と性能向上により,近年,シングルショット検出器が注目されている。
複雑なスケールのバリエーションを解決するため、単一ショット検出器は複数のピラミッド層に基づいてスケール認識予測を行う。
しかし、ピラミッドの機能は十分にスケール認識できず、検出性能が制限される。
物体スケールの変動に起因する単発検出器の2つの一般的な問題は、(1)小さな物体が容易に見逃され、(2)大きな物体の突出部が物体として検出されることがある。
そこで本研究では,ピラミッドの特徴を再設定し,スケールアウェアな特徴を探索するNighbor Erasing and Transferring(NET)機構を提案する。
NETでは、NEM(Neighbor Erasing Module)は、大きなオブジェクトの健全な特徴を消去し、浅いレイヤ内の小さなオブジェクトの特徴を強調するように設計されている。
消去された特徴を転送し、深層で大きなオブジェクトをハイライトするために、隣接トランスファーモジュール(ntm)が導入された。
このメカニズムにより、スケールアウェアオブジェクト検出のためにnetnetと呼ばれるシングルショットネットワークが構築される。
さらに,最寄りのピラミッドの特徴を集約し,ネットを強化することを提案する。
NETNetは27 FPSで38.5%AP、MS COCOデータセットで55 FPSで32.0%APを達成した。
結果として、Netはリアルタイムかつ正確なオブジェクト検出のためのより良いトレードオフを達成する。
関連論文リスト
- 3D Small Object Detection with Dynamic Spatial Pruning [66.46587362456157]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - Model-Agnostic Hierarchical Attention for 3D Object Detection [81.33112745926113]
変圧器を用いた3次元検出器のためのモジュラー化階層設計として,2つの新しい注意機構を提案する。
異なるスケールで機能学習を可能にするために,単一スケールの入力機能から複数スケールのトークンを構築するシンプルなマルチスケールアテンションを提案する。
局所的特徴集約のために,各バウンディングボックスの提案に対して適応的なアテンション範囲を持つサイズ適応型局所アテンションを提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - Point-to-Box Network for Accurate Object Detection via Single Point
Supervision [51.95993495703855]
オフ・ザ・シェルフ提案法(OTSP)の軽量な代替手法を提案する。
P2BNetは、アンカーのような方法で提案を生成することで、オブジェクト間のバランスの取れた提案バッグを構築することができる。
コードはCOCO.com/ucas-vg/P2BNetでリリースされる。
論文 参考訳(メタデータ) (2022-07-14T11:32:00Z) - Enhanced Single-shot Detector for Small Object Detection in Remote
Sensing Images [33.84369068593722]
小型物体検出のための画像ピラミッド単発検出器(IPSSD)を提案する。
IPSSDでは、単一ショット検出器と画像ピラミッドネットワークを組み合わせて、候補領域を生成するための意味的に強い特徴を抽出する。
提案するネットワークは,特徴ピラミッドネットワークから小規模な特徴を拡張できる。
論文 参考訳(メタデータ) (2022-05-12T07:35:07Z) - Lightweight Salient Object Detection in Optical Remote Sensing Images
via Feature Correlation [93.80710126516405]
本稿では,これらの問題に対処する軽量ORSI-SODソリューションであるCorrNetを提案する。
それぞれのコンポーネントのパラメータと計算を減らし、CorrNetは4.09Mのパラメータしか持たず、21.09GのFLOPで実行している。
2つの公開データセットの実験結果から、私たちの軽量なCorrNetは、26の最先端メソッドと比較して、競争力やパフォーマンスがさらに向上することが示された。
論文 参考訳(メタデータ) (2022-01-20T08:28:01Z) - Fast Camouflaged Object Detection via Edge-based Reversible
Re-calibration Network [17.538512222905087]
本稿では,ERRNetと呼ばれるエッジベースの可逆再校正ネットワークを提案する。
Selective Edge Aggregation(SEA)とReversible Re-calibration Unit(RRU)の2つの革新的な設計が特徴である。
実験の結果,ERRNetは3つのCODデータセットと5つの医用画像セグメンテーションデータセットで既存の最先端ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2021-11-05T02:03:54Z) - Rethinking the Aligned and Misaligned Features in One-stage Object
Detection [9.270523894683278]
1段階の物体検出器は、検出結果を予測するために点特徴に依存する。
タスク毎に整列および非整合性を生成できるシンプルでプラグイン演算子を提案する。
OAT(object-aligned and task-disentangled operator)に基づくOAT-Netを提案する。
論文 参考訳(メタデータ) (2021-08-27T08:40:37Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - PENet: Object Detection using Points Estimation in Aerial Images [9.33900415971554]
これらの課題に対処するために,新しいネットワーク構造であるポイント推定ネットワーク(PENet)を提案する。
PENetはMask Resampling Module(MRM)を使用して、不均衡なデータセットを増大させ、粗いアンカーフリー検出器(CPEN)で小さなオブジェクトクラスタの中心点を効果的に予測し、微細なアンカーフリー検出器FPENで小さなオブジェクトの正確な位置を特定する。
航空データセット visDrone と UAVDT による実験により,PENet は既存の最先端手法よりも精度の高い結果を得た。
論文 参考訳(メタデータ) (2020-01-22T19:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。