論文の概要: Learning Calibrated-Guidance for Object Detection in Aerial Images
- arxiv url: http://arxiv.org/abs/2103.11399v1
- Date: Sun, 21 Mar 2021 13:55:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:32:40.442657
- Title: Learning Calibrated-Guidance for Object Detection in Aerial Images
- Title(参考訳): 空中画像における物体検出のための学習校正ガイド
- Authors: Dong Liang, Zongqi Wei, Dong Zhang, Qixiang Geng, Liyan Zhang, Han
Sun, Huiyu Zhou, Mingqiang Wei, Pan Gao
- Abstract要約: 特徴変換器方式でチャネル通信を強化するキャリブレーション・ガイダンス方式を提案する。
私たちのCGは、CG-Netという名前の深いニューラルネットワークに接続することができます。
- 参考スコア(独自算出の注目度): 27.922626207443994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the study on object detection in aerial images has made tremendous
progress in the community of computer vision. However, most state-of-the-art
methods tend to develop elaborate attention mechanisms for the space-time
feature calibrations with high computational complexity, while surprisingly
ignoring the importance of feature calibrations in channels. In this work, we
propose a simple yet effective Calibrated-Guidance (CG) scheme to enhance
channel communications in a feature transformer fashion, which can adaptively
determine the calibration weights for each channel based on the global feature
affinity-pairs. Specifically, given a set of feature maps, CG first computes
the feature similarity between each channel and the remaining channels as the
intermediary calibration guidance. Then, re-representing each channel by
aggregating all the channels weighted together via the guidance. Our CG can be
plugged into any deep neural network, which is named as CG-Net. To demonstrate
its effectiveness and efficiency, extensive experiments are carried out on both
oriented and horizontal object detection tasks of aerial images. Results on two
challenging benchmarks (i.e., DOTA and HRSC2016) demonstrate that our CG-Net
can achieve state-of-the-art performance in accuracy with a fair computational
overhead. https://github.com/WeiZongqi/CG-Net
- Abstract(参考訳): 近年,空中画像における物体検出の研究は,コンピュータビジョンのコミュニティにおいて大きな進歩を遂げている。
しかし、最先端の手法の多くは計算量の高い時空特徴量校正に精巧な注意機構を発達させる傾向があるが、チャネルにおける特徴量校正の重要性は驚くほど無視されている。
本研究では,グローバルな特徴親和性ペアに基づいて各チャネルのキャリブレーション重みを適応的に決定できる,機能トランスフォーマ方式でチャネル通信を強化するための,シンプルで効果的なキャリブレーション・ガイダンス(CG)方式を提案する。
具体的には、機能マップのセットを与えられたcgは、仲介キャリブレーションガイダンスとして、まず各チャネルと残りのチャネル間の特徴類似度を計算する。
そして、ガイドを介して重み付けされた全てのチャンネルを集約することで、各チャンネルを再表現する。
私たちのCGは、CG-Netという名前のディープニューラルネットワークに接続することができます。
その有効性と効率性を示すため、空中画像の指向性および水平方向の物体検出タスクについて広範な実験を行った。
2つの挑戦的なベンチマーク(DOTAとHRSC2016)の結果は、CG-Netが高い計算オーバーヘッドで最先端のパフォーマンスを達成できることを示した。
https://github.com/WeiZongqi/CG-Net
関連論文リスト
- Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Efficient Multi-Scale Attention Module with Cross-Spatial Learning [4.046170185945849]
効率的なマルチスケールアテンション(EMA)モジュールを提案する。
チャネルごとの情報保持と計算オーバーヘッドの低減に重点を置いている。
我々は画像分類と物体検出タスクについて広範囲にわたるアブレーション研究と実験を行った。
論文 参考訳(メタデータ) (2023-05-23T00:35:47Z) - Towards Improving Workers' Safety and Progress Monitoring of
Construction Sites Through Construction Site Understanding [0.0]
我々は,グローバルな特徴親和性関連に基づくチャネル関係を改善するために,軽量なOPモジュールを提案する。
OP-Netは、あらゆるディープニューラルネットワークにプラグインできる一般的なディープニューラルネットワークモジュールである。
SODAを用いたベンチマークテストでは、OP-Netが新しい最先端性能を精度良く達成できることを示した。
論文 参考訳(メタデータ) (2022-10-27T20:33:46Z) - Group Fisher Pruning for Practical Network Compression [58.25776612812883]
本稿では,様々な複雑な構造に応用可能な汎用チャネルプルーニング手法を提案する。
我々は、単一チャネルと結合チャネルの重要性を評価するために、フィッシャー情報に基づく統一されたメトリクスを導出する。
提案手法は,結合チャネルを含む任意の構造をプルークするために利用できる。
論文 参考訳(メタデータ) (2021-08-02T08:21:44Z) - CT-Net: Channel Tensorization Network for Video Classification [48.4482794950675]
3D畳み込みはビデオ分類には強力だが、しばしば計算コストがかかる。
ほとんどのアプローチは、畳み込み効率と機能的相互作用の十分性の間の好適なバランスを達成できない。
簡潔で斬新なチャネルネットワーク(CT-Net)を提案する。
我々のCT-Netは、精度および/または効率の点で、最近のSOTAアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-06-03T05:35:43Z) - Urban Change Detection by Fully Convolutional Siamese Concatenate
Network with Attention [0.6999740786886537]
変更検出(CD)はリモートセンシング、特に都市管理における災害時において重要な問題である。
オブジェクトベースのモデルは、非常に高解像度のリモートセンシング(VHR RS)画像を扱うピクセルベースの手法に好まれる。
本稿では,VHR RS画像の完全自動変化検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-31T17:47:16Z) - Channelized Axial Attention for Semantic Segmentation [70.14921019774793]
チャネルアキシャルアテンション(CAA)を提案し、チャネルアテンションと軸アテンションをシームレスに統合し、計算複雑性を低減します。
私たちのCAAは、DANetのような他の注意モデルに比べて計算リソースをはるかに少なくするだけでなく、すべての検証済みデータセット上で最先端のResNet-101ベースのセグメンテーションモデルよりも優れています。
論文 参考訳(メタデータ) (2021-01-19T03:08:03Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Approximating the Hotelling Observer with Autoencoder-Learned Efficient
Channels for Binary Signal Detection Tasks [12.521662223741671]
画像品質(IQ)の客観的評価は、医用画像システムの解析と最適化のために提唱されている。
オートエンコーダ(AE)を用いたチャネル学習手法を提案する。
AEは、次元を減らすためにデータの簡潔な表現を学ぶために頻繁に使用される、人工知能(ANN)の一種である。
論文 参考訳(メタデータ) (2020-03-04T20:24:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。