論文の概要: FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection
- arxiv url: http://arxiv.org/abs/2504.20670v1
- Date: Tue, 29 Apr 2025 11:53:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.876513
- Title: FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection
- Title(参考訳): FBRT-YOLO:リアルタイム空中画像検出の高速化と改善
- Authors: Yao Xiao, Tingfa Xu, Yu Xin, Jianan Li,
- Abstract要約: そこで本研究では,FBRT-YOLOと呼ばれる空中画像検出用リアルタイム検出器のファミリーを提案し,検出精度と効率の相違に対処する。
FCMは、ディープネットワークにおける小さなターゲット情報の損失に起因する情報不均衡の問題を軽減することに焦点を当てている。
MKPは異なる大きさのカーネルとの畳み込みを利用して、様々なスケールのターゲット間の関係を強化する。
- 参考スコア(独自算出の注目度): 21.38164867490915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embedded flight devices with visual capabilities have become essential for a wide range of applications. In aerial image detection, while many existing methods have partially addressed the issue of small target detection, challenges remain in optimizing small target detection and balancing detection accuracy with efficiency. These issues are key obstacles to the advancement of real-time aerial image detection. In this paper, we propose a new family of real-time detectors for aerial image detection, named FBRT-YOLO, to address the imbalance between detection accuracy and efficiency. Our method comprises two lightweight modules: Feature Complementary Mapping Module (FCM) and Multi-Kernel Perception Unit(MKP), designed to enhance object perception for small targets in aerial images. FCM focuses on alleviating the problem of information imbalance caused by the loss of small target information in deep networks. It aims to integrate spatial positional information of targets more deeply into the network,better aligning with semantic information in the deeper layers to improve the localization of small targets. We introduce MKP, which leverages convolutions with kernels of different sizes to enhance the relationships between targets of various scales and improve the perception of targets at different scales. Extensive experimental results on three major aerial image datasets, including Visdrone, UAVDT, and AI-TOD,demonstrate that FBRT-YOLO outperforms various real-time detectors in terms of performance and speed.
- Abstract(参考訳): 視覚機能を備えた組み込み飛行装置は、幅広い用途に欠かせないものとなっている。
空中画像検出では、多くの既存手法が小さな目標検出の問題に部分的に対処しているが、小さな目標検出を最適化し、検出精度と効率のバランスをとることが課題である。
これらの問題は、リアルタイム空中画像検出の進歩の鍵となる障害である。
本稿では,FBRT-YOLOと呼ばれる空中画像検出用実時間検出器のファミリーを提案し,検出精度と効率の相違に対処する。
本手法は2つの軽量モジュールからなる。特徴補完マッピングモジュール(FCM)とMKP(Multi-Kernel Perception Unit)である。
FCMは、ディープネットワークにおける小さなターゲット情報の損失に起因する情報不均衡の問題を軽減することに焦点を当てている。
ターゲットの空間的位置情報をネットワークに深く統合し、より深い層内の意味情報と整合させて、小さなターゲットの局所化を改善することを目的としている。
異なるサイズのカーネルとの畳み込みを利用して、様々なスケールのターゲット間の関係を高め、異なるスケールでのターゲットの認識を改善するMKPを紹介する。
Visdrone、UAVDT、AI-TODを含む3つの主要な空中画像データセットの大規模な実験結果によると、FBRT-YOLOは性能と速度で様々なリアルタイム検出器より優れている。
関連論文リスト
- Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach [1.90298817989995]
マルチモーダル画像融合とアテンション機構に基づく小さなターゲット検出手法を提案する。
この方法はYOLOv5を活用し、赤外線および可視光データと畳み込みアテンションモジュールを統合して検出性能を向上させる。
対UAVおよびVisdroneデータセットの実験結果は、我々のアプローチの有効性と実用性を示している。
論文 参考訳(メタデータ) (2025-04-15T15:02:10Z) - YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.32985979395737786]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。
YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。
リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文 参考訳(メタデータ) (2025-04-15T13:13:22Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Towards Robust Infrared Small Target Detection: A Feature-Enhanced and Sensitivity-Tunable Framework [2.4810332733338623]
本稿では,既存のSIRST検出ネットワークと互換性のあるFEST(Feature Enhanced and sensitivity-tunable)フレームワークを提案する。
我々のFESTフレームワークは既存のSIRST検出ネットワークの性能を大幅に向上させることができることを示す。
特に、FESTフレームワークを備えたマルチスケール方向認識ネットワーク(MSDA-Net)は、PRCV 2024広帯域赤外線小目標検出コンテストで優勝した。
論文 参考訳(メタデータ) (2024-07-29T15:22:02Z) - DASSF: Dynamic-Attention Scale-Sequence Fusion for Aerial Object Detection [6.635903943457569]
元のYOLOアルゴリズムは、異なるスケールのターゲットを認識する能力の弱いため、全体的な検出精度が低い。
本稿では,空中画像のターゲット検出のための動的アテンションスケール系列融合アルゴリズム(DASSF)を提案する。
DASSF法をYOLOv8nと比較すると,平均平均精度(mAP)は9.2%,2.4%増加した。
論文 参考訳(メタデータ) (2024-06-18T05:26:44Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - PENet: Object Detection using Points Estimation in Aerial Images [9.33900415971554]
これらの課題に対処するために,新しいネットワーク構造であるポイント推定ネットワーク(PENet)を提案する。
PENetはMask Resampling Module(MRM)を使用して、不均衡なデータセットを増大させ、粗いアンカーフリー検出器(CPEN)で小さなオブジェクトクラスタの中心点を効果的に予測し、微細なアンカーフリー検出器FPENで小さなオブジェクトの正確な位置を特定する。
航空データセット visDrone と UAVDT による実験により,PENet は既存の最先端手法よりも精度の高い結果を得た。
論文 参考訳(メタデータ) (2020-01-22T19:43:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。