論文の概要: Learning to Reduce Information Bottleneck for Object Detection in Aerial
Images
- arxiv url: http://arxiv.org/abs/2204.02033v1
- Date: Tue, 5 Apr 2022 07:46:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 20:14:24.472179
- Title: Learning to Reduce Information Bottleneck for Object Detection in Aerial
Images
- Title(参考訳): 航空機画像における物体検出のための情報量削減学習
- Authors: Yuchen Shen and Zhihao Song and Liyong Fu and Xuesong Jiang and
Qiaolin Ye
- Abstract要約: まず,情報ボトルネックの理論から,オブジェクト検出フレームワークにおけるネックネットワークの重要性を分析する。
バックボーンからヘッドネットワークへのブリッジとして機能するグローバルセマンティックネットワークを,双方向のグローバル畳み込み方式で提案する。
既存のネックネットワークと比較して,より詳細な情報と計算コストの低減という利点がある。
- 参考スコア(独自算出の注目度): 5.4547979989237225
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection in aerial images is a fundamental research topic in the
domain of geoscience and remote sensing. However, advanced progresses on this
topic are mainly focused on the designment of backbone networks or header
networks, but surprisingly ignored the neck ones. In this letter, we first
analyse the importance of the neck network in object detection frameworks from
the theory of information bottleneck. Then, to alleviate the information loss
problem in the current neck network, we propose a global semantic network,
which acts as a bridge from the backbone to the head network in a bidirectional
global convolution manner. Compared to the existing neck networks, our method
has advantages of capturing rich detailed information and less computational
costs. Moreover, we further propose a fusion refinement module, which is used
for feature fusion with rich details from different scales. To demonstrate the
effectiveness and efficiency of our method, experiments are carried out on two
challenging datasets (i.e., DOTA and HRSC2016). Results in terms of accuracy
and computational complexity both can verify the superiority of our method.
- Abstract(参考訳): 空中画像における物体検出は、地球科学とリモートセンシングの分野における基本的な研究テーマである。
しかしながら、このトピックの進歩は主にバックボーンネットワークやヘッダネットワークの設計に焦点を当てているが、驚くほどネックネットワークを無視している。
本稿では,まず,情報ボトルネックの理論から物体検出フレームワークにおけるネックネットワークの重要性を分析する。
次に,現在のネックネットワークにおける情報損失問題を軽減するため,双方向のグローバル畳み込み方式で,バックボーンからヘッドネットワークへのブリッジとして機能するグローバルセマンティックネットワークを提案する。
既存のネックネットワークと比較して,より詳細な情報と計算コストの低減という利点がある。
さらに,異なるスケールからの豊富な詳細を持つ機能融合に使用されるフュージョンリファインメントモジュールを提案する。
本手法の有効性と有効性を示すため,2つの挑戦的データセット(DOTAとHRSC2016)を用いて実験を行った。
精度と計算複雑性の両面から,本手法の優位性を検証できる。
関連論文リスト
- Single-Point Supervised High-Resolution Dynamic Network for Infrared Small Target Detection [7.0456782736205685]
単一点教師付き高分解能ダイナミックネットワーク(SSHD-Net)を提案する。
単一点監視のみを用いて、最先端(SOTA)検出性能を実現する。
公開データセット NUDT-SIRST と IRSTD-1k の実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-04T09:44:47Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Lightweight Convolutional Neural Network with Gaussian-based Grasping
Representation for Robotic Grasping Detection [4.683939045230724]
現在の物体検出器は、高い精度と高速な推論速度のバランスを取るのが難しい。
ロボットつかみポーズ推定を行うための効率的かつ堅牢な完全畳み込みニューラルネットワークモデルを提案する。
ネットワークは、他の優れたアルゴリズムよりも桁違いに小さい順序です。
論文 参考訳(メタデータ) (2021-01-25T16:36:53Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。