論文の概要: CollabOD: Collaborative Multi-Backbone with Cross-scale Vision for UAV Small Object Detection
- arxiv url: http://arxiv.org/abs/2603.05905v1
- Date: Fri, 06 Mar 2026 04:49:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.09082
- Title: CollabOD: Collaborative Multi-Backbone with Cross-scale Vision for UAV Small Object Detection
- Title(参考訳): CollabOD:UAV小物体検出のためのクロススケールビジョンを用いた協調型マルチバックボーン
- Authors: Xuecheng Bai, Yuxiang Wang, Chuanzhi Xu, Boyu Hu, Kang Han, Ruijie Pan, Xiaowei Niu, Xiaotian Guan, Liqiang Fu, Pengfei Ye,
- Abstract要約: 無人航空機(UAV)画像の小型物体検出は、スケールのばらつき、構造的詳細劣化、限られた計算資源により困難である。
構造的詳細を明示的に保存し,異質な特徴ストリームを整列する,軽量な協調検出フレームワークであるCollabODを提案する。
提案手法は,効率的な推論を維持しつつ表現安定性を向上させる。
- 参考スコア(独自算出の注目度): 17.445022874333407
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Small object detection in unmanned aerial vehicle (UAV) imagery is challenging, mainly due to scale variation, structural detail degradation, and limited computational resources. In high-altitude scenarios, fine-grained features are further weakened during hierarchical downsampling and cross-scale fusion, resulting in unstable localization and reduced robustness. To address this issue, we propose CollabOD, a lightweight collaborative detection framework that explicitly preserves structural details and aligns heterogeneous feature streams before multi-scale fusion. The framework integrates Structural Detail Preservation, Cross-Path Feature Alignment, and Localization-Aware Lightweight Design strategies. From the perspectives of image processing, channel structure, and lightweight design, it optimizes the architecture of conventional UAV perception models. The proposed design enhances representation stability while maintaining efficient inference. A unified detail-aware detection head further improves regression robustness without introducing additional deployment overhead. The code is available at: https://github.com/Bai-Xuecheng/CollabOD.
- Abstract(参考訳): 無人航空機(UAV)画像における小さな物体検出は、主にスケールのばらつき、構造的詳細劣化、限られた計算資源によって困難である。
高高度のシナリオでは、階層的なダウンサンプリングとクロススケールな融合の間に、きめ細かい特徴がさらに弱まり、不安定な局所化とロバストネスが低下する。
この問題に対処するため,マルチスケール核融合前に構造的詳細を明示的に保存し,異質な特徴ストリームを整列する軽量協調検出フレームワークCollabODを提案する。
このフレームワークは、構造的詳細保存、クロスパス機能アライメント、およびローカライズ対応軽量設計戦略を統合している。
画像処理,チャネル構造,軽量設計の観点から,従来のUAV知覚モデルのアーキテクチャを最適化する。
提案手法は,効率的な推論を維持しつつ表現安定性を向上させる。
統合された詳細認識検出ヘッドは、追加のデプロイメントオーバーヘッドを導入することなく、レグレッションロバスト性をさらに向上する。
コードは、https://github.com/Bai-Xuecheng/CollabOD.comで入手できる。
関連論文リスト
- IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。
本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。
本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。
我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文 参考訳(メタデータ) (2025-12-11T12:20:31Z) - TinyDef-DETR: A Transformer-Based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.48571944931548]
TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文 参考訳(メタデータ) (2025-09-07T12:36:33Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Cross-SRN: Structure-Preserving Super-Resolution Network with Cross
Convolution [64.76159006851151]
低解像度 (LR) 画像から高解像度 (SR) 画像への復元は, 正確かつ明確である。
既存のディープラーニングは、画像の固有の構造情報をほとんど無視する。
構造情報の探索と保存を行う階層的特徴利用ネットワークを設計する。
論文 参考訳(メタデータ) (2022-01-05T05:15:01Z) - Multi-Scale Boosted Dehazing Network with Dense Feature Fusion [92.92572594942071]
U-Netアーキテクチャに基づくDense Feature Fusionを用いたマルチスケールブーストデハージングネットワークを提案する。
提案モデルでは,ベンチマークデータセットや実世界のハジー画像に対する最先端のアプローチに対して,好意的に機能することを示す。
論文 参考訳(メタデータ) (2020-04-28T09:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。