論文の概要: LO-Det: Lightweight Oriented Object Detection in Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2209.07709v1
- Date: Fri, 16 Sep 2022 04:28:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 12:42:58.749841
- Title: LO-Det: Lightweight Oriented Object Detection in Remote Sensing Images
- Title(参考訳): lo-det: リモートセンシング画像における軽量指向オブジェクト検出
- Authors: Zhanchao Huang, Wei Li, Xiang-Gen Xia, Hao Wang, Feiran Jie, and Ran
Tao
- Abstract要約: 本稿では,有効軽量指向型物体検出器(LO-Det)を提案する。
特に、チャネル分離集約(CSA)構造は、積み重ねられた分離可能な畳み込みの複雑さを単純化するために設計されている。
提案するLO-Detは、オブジェクト指向物体を検出するための競合精度で、組み込みデバイスでも非常に高速に動作可能である。
- 参考スコア(独自算出の注目度): 11.41884406231953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A few lightweight convolutional neural network (CNN) models have been
recently designed for remote sensing object detection (RSOD). However, most of
them simply replace vanilla convolutions with stacked separable convolutions,
which may not be efficient due to a lot of precision losses and may not be able
to detect oriented bounding boxes (OBB). Also, the existing OBB detection
methods are difficult to constrain the shape of objects predicted by CNNs
accurately. In this paper, we propose an effective lightweight oriented object
detector (LO-Det). Specifically, a channel separation-aggregation (CSA)
structure is designed to simplify the complexity of stacked separable
convolutions, and a dynamic receptive field (DRF) mechanism is developed to
maintain high accuracy by customizing the convolution kernel and its perception
range dynamically when reducing the network complexity. The CSA-DRF component
optimizes efficiency while maintaining high accuracy. Then, a diagonal support
constraint head (DSC-Head) component is designed to detect OBBs and constrain
their shapes more accurately and stably. Extensive experiments on public
datasets demonstrate that the proposed LO-Det can run very fast even on
embedded devices with the competitive accuracy of detecting oriented objects.
- Abstract(参考訳): リモートセンシングオブジェクト検出(RSOD)のために、いくつかの軽量畳み込みニューラルネットワーク(CNN)モデルが最近設計されている。
しかし、その多くは単にバニラの畳み込みを積み重ねた分離可能な畳み込みに置き換えるだけであり、これは多くの精度の損失のために効率的ではなく、向き付けられた束縛箱(OBB)を検出できない可能性がある。
また,既存のobb検出手法では,cnnが予測する物体の形状を正確に制約することは困難である。
本稿では,効率的な軽量指向物体検出器(lo-det)を提案する。
具体的には、重畳された分離可能な畳み込みの複雑さを単純化するためにチャネル分離集約(CSA)構造を設計し、ネットワークの複雑さを低減する際に、畳み込みカーネルとその知覚範囲を動的にカスタマイズすることにより高い精度を維持する動的受容場(DRF)機構を開発する。
CSA-DRFコンポーネントは高い精度を維持しながら効率を最適化する。
次に、対角支持制約ヘッド(DSC-ヘッド)コンポーネントを、OBBを検出し、その形状をより正確に安定的に拘束するように設計する。
公開データセットに関する広範囲な実験により、提案するlo-detは、指向オブジェクト検出の競合精度を備えた組み込みデバイスでも非常に高速に動作できることが示されている。
関連論文リスト
- Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Spatial-Temporal Enhanced Transformer Towards Multi-Frame 3D Object
Detection [59.03596380773798]
我々は、DETRのようなパラダイムに基づいた、多フレーム3Dオブジェクト検出のための新しいエンドツーエンドフレームワークであるSTEMDを提案する。
具体的には、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
我々は,計算オーバーヘッドをわずかに加えるだけで,難解なシナリオに対処する手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - CAINNFlow: Convolutional block Attention modules and Invertible Neural
Networks Flow for anomaly detection and localization tasks [28.835943674247346]
本研究では, CBAMを組み込んだ複雑な関数モデルの設計を行い, 空間構造情報の保持と抽出を効果的に行うことができる。
CAINNFlowは,CNNとTransformerのバックボーンネットワークを特徴抽出器として,高度な精度と推論効率を実現する。
論文 参考訳(メタデータ) (2022-06-04T13:45:08Z) - Double-Dot Network for Antipodal Grasp Detection [20.21384585441404]
本稿では,Double-Dot Network (DD-Net) という,対足足歩行検出のための新しい深層学習手法を提案する。
これは、経験的にプリセットされたアンカーに依存しない最近のアンカーフリーなオブジェクト検出フレームワークに従っている。
このような指先をローカライズするために効果的なCNNアーキテクチャを導入し、改良のための補助センターの助けを借りて、把握候補を正確かつ堅牢に推測する。
論文 参考訳(メタデータ) (2021-08-03T14:21:17Z) - Oriented Object Detection with Transformer [51.634913687632604]
我々は,エンドツーエンドネットワークに基づくTRansformer(bf O2DETR$)によるオブジェクト指向オブジェクト検出を実装した。
注意機構を奥行き分離可能な畳み込みに置き換えることで,トランスフォーマーの簡易かつ高効率なエンコーダを設計する。
私たちの$rm O2DETR$は、オブジェクト指向オブジェクト検出の分野における別の新しいベンチマークになり、より高速なR-CNNとRetinaNetに対して最大3.85mAPの改善が達成されます。
論文 参考訳(メタデータ) (2021-06-06T14:57:17Z) - Lightweight Convolutional Neural Network with Gaussian-based Grasping
Representation for Robotic Grasping Detection [4.683939045230724]
現在の物体検出器は、高い精度と高速な推論速度のバランスを取るのが難しい。
ロボットつかみポーズ推定を行うための効率的かつ堅牢な完全畳み込みニューラルネットワークモデルを提案する。
ネットワークは、他の優れたアルゴリズムよりも桁違いに小さい順序です。
論文 参考訳(メタデータ) (2021-01-25T16:36:53Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z) - Selective Convolutional Network: An Efficient Object Detector with
Ignoring Background [28.591619763438054]
Selective Convolutional Network (SCN) と呼ばれる効率的なオブジェクト検出器を導入し、意味のある情報を含む場所のみを選択的に計算する。
そこで本稿では,ネットワークの次を導くためのオーバーヘッドを無視できるような,精巧な構造を設計する。
論文 参考訳(メタデータ) (2020-02-04T10:07:01Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z) - An Image Enhancing Pattern-based Sparsity for Real-time Inference on
Mobile Devices [58.62801151916888]
パターンと接続性を組み合わせた新しい空間空間,すなわちパターンベースの空間空間を導入し,高度に正確かつハードウェアに親しみやすいものにした。
新たなパターンベースの空間性に対する我々のアプローチは,モバイルプラットフォーム上での高効率DNN実行のためのコンパイラ最適化に自然に適合する。
論文 参考訳(メタデータ) (2020-01-20T16:17:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。