論文の概要: SFFNet: Synergistic Feature Fusion Network With Dual-Domain Edge Enhancement for UAV Image Object Detection
- arxiv url: http://arxiv.org/abs/2604.03176v1
- Date: Fri, 03 Apr 2026 16:52:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.53985
- Title: SFFNet: Synergistic Feature Fusion Network With Dual-Domain Edge Enhancement for UAV Image Object Detection
- Title(参考訳): SFFNet:UAV画像オブジェクト検出のためのデュアルドメインエッジ拡張による相乗的特徴融合ネットワーク
- Authors: Wenfeng Zhang, Jun Ni, Yue Meng, Xiaodong Pei, Wei Hu, Qibing Qin, Lei Huang,
- Abstract要約: 無人航空機(UAV)画像における物体検出は非常に難しい課題である。
我々は,UAV画像の物体検出に適した2領域エッジ拡張を備えた相乗的特徴融合ネットワーク(SFFNet)を開発した。
2つの挑戦的な空中データセットの実験は、SFFNet-Xの卓越した性能を示している。
- 参考スコア(独自算出の注目度): 25.963089047314963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection in unmanned aerial vehicle (UAV) images remains a highly challenging task, primarily caused by the complexity of background noise and the imbalance of target scales. Traditional methods easily struggle to effectively separate objects from intricate backgrounds and fail to fully leverage the rich multi-scale information contained within images. To address these issues, we have developed a synergistic feature fusion network (SFFNet) with dual-domain edge enhancement specifically tailored for object detection in UAV images. Firstly, the multi-scale dynamic dual-domain coupling (MDDC) module is designed. This component introduces a dual-driven edge extraction architecture that operates in both the frequency and spatial domains, enabling effective decoupling of multi-scale object edges from background noise. Secondly, to further enhance the representation capability of the model's neck in terms of both geometric and semantic information, a synergistic feature pyramid network (SFPN) is proposed. SFPN leverages linear deformable convolutions to adaptively capture irregular object shapes and establishes long-range contextual associations around targets through the designed wide-area perception module (WPM). Moreover, to adapt to the various applications or resource-constrained scenarios, six detectors of different scales (N/S/M/B/L/X) are designed. Experiments on two challenging aerial datasets (VisDrone and UAVDT) demonstrate the outstanding performance of SFFNet-X, achieving 36.8 AP and 20.6 AP, respectively. The lightweight models (N/S) also maintain a balance between detection accuracy and parameter efficiency. The code will be available at https://github.com/CQNU-ZhangLab/SFFNet.
- Abstract(参考訳): 無人航空機(UAV)画像における物体検出は、主に背景雑音の複雑さと目標スケールの不均衡に起因する非常に困難な課題である。
従来の手法では、複雑な背景からオブジェクトを効果的に分離することは困難であり、画像に含まれるリッチなマルチスケール情報を完全に活用できない。
これらの問題に対処するため,UAV画像の物体検出に適した2領域エッジ拡張を備えた相乗的特徴融合ネットワーク(SFFNet)を開発した。
まず,マルチスケール動的二重ドメイン結合(MDDC)モジュールを設計する。
このコンポーネントは、周波数領域と空間領域の両方で動作するデュアル駆動エッジ抽出アーキテクチャを導入し、背景雑音からマルチスケールオブジェクトエッジを効果的に分離することを可能にする。
次に、幾何情報と意味情報の両方の観点からモデル首の表現能力を更に高めるために、相乗的特徴ピラミッドネットワーク(SFPN)を提案する。
SFPNは線形変形可能な畳み込みを利用して不規則な物体の形状を適応的に捕捉し、設計されたワイドエリア認識モジュール(WPM)を介してターゲット周辺の長距離コンテキスト関連を確立する。
さらに、様々な応用や資源制約のシナリオに適応するために、異なるスケールの6つの検出器(N/S/M/B/L/X)が設計されている。
2つの挑戦的な航空データセット(VisDroneとUAVDT)の実験は、それぞれ36.8 APと20.6 APを達成したSFFNet-Xの優れた性能を示した。
軽量モデル(N/S)は検出精度とパラメータ効率のバランスを保っている。
コードはhttps://github.com/CQNU-ZhangLab/SFFNet.comから入手できる。
関連論文リスト
- G2HFNet: GeoGran-Aware Hierarchical Feature Fusion Network for Salient Object Detection in Optical Remote Sensing Images [76.1829298714382]
既存の手法では、一様注意機構を用いて複数の特徴を単一スケールで抽出するのが一般的である。
光リモートセンシング画像における幾何的および粒度をフル活用するGeoGran-Aware grained Feature Fusion Network (G2HFNet)を提案する。
論文 参考訳(メタデータ) (2026-03-13T05:52:00Z) - Dual-Perspective United Transformer for Object Segmentation in Optical Remote Sensing Images [38.942152581251165]
本稿では,長距離依存関係と空間的詳細を同時に統合するユニークな構造を持つDPU変換器を提案する。
特に,2つの視点から多種多様な情報を捉えるグローバル・ローカル・ミックス・アテンションを設計する。
本稿では,表現能力を高めるために,ゲート型線形フィードフォワードネットワークを提案する。
論文 参考訳(メタデータ) (2025-06-27T02:40:48Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Multi-Projection Fusion and Refinement Network for Salient Object
Detection in 360{\deg} Omnidirectional Image [141.10227079090419]
我々は,360度全方位画像中の有向物体を検出するために,MPFR-Net(Multi-Projection Fusion and Refinement Network)を提案する。
MPFR-Netは、等角射影像と対応する4つの立方体展開像を入力として使用する。
2つの全方位データセットの実験結果から,提案手法は定性的かつ定量的に,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-12-23T14:50:40Z) - Dense Multiscale Feature Fusion Pyramid Networks for Object Detection in
UAV-Captured Images [0.09065034043031667]
本研究では,よりリッチな特徴を可能な限り得ることを目的とした,高密度多スケール特徴融合ピラミッドネットワーク(dmffpn)と呼ばれる新しい手法を提案する。
具体的には、密度の高い接続は、異なる畳み込み層からの表現を完全に活用するように設計されている。
VisDrone-DETと呼ばれるドローンベースのデータセットの実験は、我々の方法の競争力を示唆している。
論文 参考訳(メタデータ) (2020-12-19T10:05:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。