論文の概要: PT-DETR: Small Target Detection Based on Partially-Aware Detail Focus
- arxiv url: http://arxiv.org/abs/2510.26630v1
- Date: Thu, 30 Oct 2025 15:57:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.894572
- Title: PT-DETR: Small Target Detection Based on Partially-Aware Detail Focus
- Title(参考訳): PT-DETR:部分認識詳細焦点に基づく小型目標検出
- Authors: Bingcong Huo, Zhiming Wang,
- Abstract要約: 本稿では,UAV画像中の小物体を対象とした新しい検出アルゴリズムPT-DETRを提案する。
バックボーンネットワークでは,小さなオブジェクトに対する特徴抽出を強化するために,部分認識詳細フォーカス (PADF) モジュールを導入する。
また,MFFF (Median-Frequency Feature Fusion) モジュールの設計を行った。
- 参考スコア(独自算出の注目度): 9.557416198772673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To address the challenges in UAV object detection, such as complex backgrounds, severe occlusion, dense small objects, and varying lighting conditions,this paper proposes PT-DETR based on RT-DETR, a novel detection algorithm specifically designed for small objects in UAV imagery. In the backbone network, we introduce the Partially-Aware Detail Focus (PADF) Module to enhance feature extraction for small objects. Additionally,we design the Median-Frequency Feature Fusion (MFFF) module,which effectively improves the model's ability to capture small-object details and contextual information. Furthermore,we incorporate Focaler-SIoU to strengthen the model's bounding box matching capability and increase its sensitivity to small-object features, thereby further enhancing detection accuracy and robustness. Compared with RT-DETR, our PT-DETR achieves mAP improvements of 1.6% and 1.7% on the VisDrone2019 dataset with lower computational complexity and fewer parameters, demonstrating its robustness and feasibility for small-object detection tasks.
- Abstract(参考訳): 複雑な背景, 密閉性, 密閉性, 各種照明条件などのUAV物体検出の課題に対処するために, RT-DETRに基づくPT-DETRを提案する。
バックボーンネットワークでは,小さなオブジェクトに対する特徴抽出を強化するために,部分認識詳細フォーカス (PADF) モジュールを導入する。
さらに,MFFF (Median-Frequency Feature Fusion) モジュールの設計を行った。
さらに,Focaler-SIoUを組み込んでモデルのバウンディングボックスマッチング機能を強化し,小対象特徴に対する感度を高め,検出精度とロバスト性をさらに高める。
RT-DETRと比較して、我々のPT-DETRは、計算複雑性が低くパラメータが少ないVisDrone2019データセットで1.6%と1.7%のmAP改善を実現し、小対象検出タスクの堅牢性と実現可能性を示している。
関連論文リスト
- RT-DETR++ for UAV Object Detection [0.0]
本稿では,RT-DETRモデルのエンコーダコンポーネントを強化するRT-DETR++を提案する。
チャネルゲート型アテンションベースアップサンプリング/ダウンサンプリング機構を導入する。
第2に,機能融合時にCSP-PACを取り入れた。
論文 参考訳(メタデータ) (2025-09-11T05:33:52Z) - RS-TinyNet: Stage-wise Feature Fusion Network for Detecting Tiny Objects in Remote Sensing Images [2.839606729957112]
本稿では,多段階機能融合・拡張モデルであるRS-TinyNetについて紹介する。
RS-TinyNetには2つの新しいデザインがある。
我々の実験によると、RS-TinyNetは既存の最先端(SOTA)検出器を4.0%APと6.5%AP75で上回っている。
論文 参考訳(メタデータ) (2025-07-17T13:34:21Z) - RFWNet: A Lightweight Remote Sensing Object Detector Integrating Multiscale Receptive Fields and Foreground Focus Mechanism [10.997183129304409]
本研究では,マルチスケールの受容場とフォアグラウンドの焦点機構を統合した,効率的かつ軽量なRSODアルゴリズムを提案する。
総合的な実験の結果、RFWNetの平均精度は95.3%、平均精度は73.2%に達した。
論文 参考訳(メタデータ) (2025-03-01T16:02:15Z) - Efficient Oriented Object Detection with Enhanced Small Object Recognition in Aerial Images [2.9138705529771123]
本稿では,オブジェクト指向物体検出タスクに適したYOLOv8モデルを新たに拡張する。
本モデルでは,ASFP(Adaptive Scale Feature Pyramid)モジュールと,P2層の詳細を利用したウェーブレット変換に基づくC2fモジュールを特徴とする。
我々のアプローチは233万のパラメータを持つDecoupleNetよりも効率的なアーキテクチャ設計を提供し、検出精度を維持しています。
論文 参考訳(メタデータ) (2024-12-17T05:45:48Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - Small Object Detection by DETR via Information Augmentation and Adaptive
Feature Fusion [4.9860018132769985]
RT-DETRモデルは、リアルタイムオブジェクト検出では良好に動作するが、小さなオブジェクト検出精度では不十分である。
異なるレベルから各特徴マップに学習可能なパラメータを割り当てる適応的特徴融合アルゴリズムを提案する。
これにより、異なるスケールでオブジェクトの特徴をキャプチャするモデルの能力が向上し、小さなオブジェクトを検出する精度が向上する。
論文 参考訳(メタデータ) (2024-01-16T00:01:23Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。