論文の概要: Fast Fourier Convolution Based Remote Sensor Image Object Detection for
Earth Observation
- arxiv url: http://arxiv.org/abs/2209.00551v1
- Date: Thu, 1 Sep 2022 15:50:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 13:19:30.869054
- Title: Fast Fourier Convolution Based Remote Sensor Image Object Detection for
Earth Observation
- Title(参考訳): 高速フーリエ畳み込みによる地球観測のためのリモートセンサ画像検出
- Authors: Gu Lingyun, Eugene Popov, Dong Ge
- Abstract要約: リモートセンシングオブジェクト検出のための周波数対応特徴ピラミッドフレームワーク(FFPF)を提案する。
F-ResNetは、周波数領域の畳み込みをバックボーンの各ステージに差し込み、スペクトルコンテキスト情報を知覚するために提案される。
BSFPNは、双方向サンプリング戦略とスキップ接続を用いて、異なるスケールの物体の特徴の関連をより良くモデル化するように設計されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensor image object detection is an important technology for Earth
observation, and is used in various tasks such as forest fire monitoring and
ocean monitoring. Image object detection technology, despite the significant
developments, is struggling to handle remote sensor images and small-scale
objects, due to the limited pixels of small objects. Numerous existing studies
have demonstrated that an effective way to promote small object detection is to
introduce the spatial context. Meanwhile, recent researches for image
classification have shown that spectral convolution operations can perceive
long-term spatial dependence more efficiently in the frequency domain than
spatial domain. Inspired by this observation, we propose a Frequency-aware
Feature Pyramid Framework (FFPF) for remote sensing object detection, which
consists of a novel Frequency-aware ResNet (F-ResNet) and a Bilateral
Spectral-aware Feature Pyramid Network (BS-FPN). Specifically, the F-ResNet is
proposed to perceive the spectral context information by plugging the frequency
domain convolution into each stage of the backbone, extracting richer features
of small objects. To the best of our knowledge, this is the first work to
introduce frequency-domain convolution into remote sensing object detection
task. In addition, the BSFPN is designed to use a bilateral sampling strategy
and skipping connection to better model the association of object features at
different scales, towards unleashing the potential of the spectral context
information from F-ResNet. Extensive experiments are conducted for object
detection in the optical remote sensing image dataset (DIOR and DOTA). The
experimental results demonstrate the excellent performance of our method. It
achieves an average accuracy (mAP) without any tricks.
- Abstract(参考訳): リモートセンシング画像検出は、地球観測において重要な技術であり、森林火災監視や海洋モニタリングなどの様々なタスクで使用されている。
画像オブジェクト検出技術は、大きな進歩にもかかわらず、小さなオブジェクトのピクセルが限られているため、リモートセンサーイメージや小さなオブジェクトを扱うのに苦労している。
多くの既存研究では、小さな物体の検出を促進する効果的な方法として、空間的文脈を導入することが示されている。
一方、画像分類に関する最近の研究は、スペクトル畳み込み操作は空間領域よりも周波数領域における長期空間依存をより効率的に知覚できることを示した。
本稿では,新しい周波数認識型ResNet(F-ResNet)とバイラテラル・スペクトル認識型Feature Pyramid Network(BS-FPN)からなる,リモートセンシング対象検出のための周波数認識型Feature Pyramid Framework(FFPF)を提案する。
具体的には、F-ResNetは、周波数領域の畳み込みをバックボーンの各ステージに挿入し、小さなオブジェクトのよりリッチな特徴を抽出することで、スペクトルコンテキスト情報を知覚する。
我々の知る限り、これはリモートセンシングオブジェクト検出タスクに周波数領域の畳み込みを導入する最初の試みである。
さらに、BSFPNは、F-ResNetからスペクトルコンテキスト情報の可能性を解き放つために、双方向サンプリング戦略とスキップ接続を用いて、異なるスケールのオブジェクト特徴の関連をより良くモデル化するように設計されている。
光リモートセンシング画像データセット (dior and dota) における物体検出のための広範な実験を行った。
実験の結果,本手法の優れた性能が得られた。
トリックなしで平均精度(mAP)を達成する。
関連論文リスト
- United Domain Cognition Network for Salient Object Detection in Optical Remote Sensing Images [21.76732661032257]
周波数領域と空間領域のグローバルローカル情報を共同で探索する新しい統一ドメイン認知ネットワーク(UDCNet)を提案する。
実験結果から提案したUDCNetが24種類の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-11T04:12:27Z) - Frequency-Spatial Entanglement Learning for Camouflaged Object Detection [34.426297468968485]
既存の手法では、複雑な設計で空間的特徴の識別能力を最大化することにより、画素類似性の影響を減らそうとしている。
本稿では,周波数領域と空間領域の表現を共同で探索し,周波数空間の絡み合い学習(FSEL)手法を提案する。
我々の実験は、広く使われている3つのデータセットにおける包括的量的および質的比較を通じて、21以上の最先端手法によるFSELの優位性を実証した。
論文 参考訳(メタデータ) (2024-09-03T07:58:47Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in
VIS and NIR Scenario [87.72258480670627]
既存の周波数領域に基づく顔偽造検出手法では、GAN鍛造画像は、実際の画像と比較して、周波数スペクトルに明らかな格子状の視覚的アーチファクトを持つ。
本稿では,コサイン変換に基づくフォージェリークリュー拡張ネットワーク(FCAN-DCT)を提案し,より包括的な時空間特徴表現を実現する。
論文 参考訳(メタデータ) (2022-07-05T09:27:53Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z) - SCRDet++: Detecting Small, Cluttered and Rotated Objects via
Instance-Level Feature Denoising and Rotation Loss Smoothing [131.04304632759033]
小さくて散らばった物体は実世界では一般的であり、検出は困難である。
本稿では,まず,物体検出にデノナイズするアイデアを革新的に紹介する。
機能マップ上のインスタンスレベルの記述は、小さくて散らばったオブジェクトの検出を強化するために行われる。
論文 参考訳(メタデータ) (2020-04-28T06:03:54Z) - Small-Object Detection in Remote Sensing Images with End-to-End
Edge-Enhanced GAN and Object Detector Network [9.135036713000513]
超高分解能GAN(ESRGAN)と呼ばれるGANベースモデルでは,画像強調性能が顕著である。
リモートセンシング画像の画質を向上させるために,新しいエッジ強化超解像GAN(EESRGAN)を提案する。
論文 参考訳(メタデータ) (2020-03-20T03:07:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。