論文の概要: A Data-Driven RetinaNet Model for Small Object Detection in Aerial Images
- arxiv url: http://arxiv.org/abs/2509.02928v1
- Date: Wed, 03 Sep 2025 01:38:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.383101
- Title: A Data-Driven RetinaNet Model for Small Object Detection in Aerial Images
- Title(参考訳): 空中画像における小型物体検出のためのデータ駆動型網膜ネットモデル
- Authors: Zhicheng Tang, Jinwen Tang, Yi Shang,
- Abstract要約: DDR-Netは、最小限のオブジェクトの検出を強化するために考案された、データ駆動のディープラーニングモデルである。
このモデルの強化された検出機能は、野生生物と生息環境のモニタリング、交通流の最適化、公共の安全改善などの重要なアプリケーションをサポートする。
- 参考スコア(独自算出の注目度): 0.34410212782758043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of aerial imaging, the ability to detect small objects is pivotal for a myriad of applications, encompassing environmental surveillance, urban design, and crisis management. Leveraging RetinaNet, this work unveils DDR-Net: a data-driven, deep-learning model devised to enhance the detection of diminutive objects. DDR-Net introduces novel, data-driven techniques to autonomously ascertain optimal feature maps and anchor estimations, cultivating a tailored and proficient training process while maintaining precision. Additionally, this paper presents an innovative sampling technique to bolster model efficacy under limited data training constraints. The model's enhanced detection capabilities support critical applications including wildlife and habitat monitoring, traffic flow optimization, and public safety improvements through accurate identification of small objects like vehicles and pedestrians. DDR-Net significantly reduces the cost and time required for data collection and training, offering efficient performance even with limited data. Empirical assessments over assorted aerial avian imagery datasets demonstrate that DDR-Net markedly surpasses RetinaNet and alternative contemporary models. These innovations advance current aerial image analysis technologies and promise wide-ranging impacts across multiple sectors including agriculture, security, and archaeology.
- Abstract(参考訳): 空中画像の分野では、環境監視、都市デザイン、危機管理を含む、無数の応用において、小さな物体を検出する能力が重要である。
RetinaNetを活用して、この研究はDDR-Netを発表した。DDR-Netは、最小限のオブジェクトの検出を強化するために開発された、データ駆動のディープラーニングモデルだ。
DDR-Netは、最適な特徴マップとアンカー推定を自律的に確認する新しいデータ駆動技術を導入し、精度を維持しながら、調整された熟練したトレーニングプロセスを育む。
さらに,本論文では,限られたデータトレーニング制約下でのモデルの有効性を高めるために,革新的なサンプリング手法を提案する。
このモデルの強化された検出機能は、野生生物や生息環境のモニタリング、交通流の最適化、車両や歩行者のような小さな物体の正確な識別による公共安全の改善などの重要な応用をサポートする。
DDR-Netは、データ収集とトレーニングに必要なコストと時間を著しく削減し、限られたデータでも効率的なパフォーマンスを提供する。
空中の鳥の画像データセットに対する実証的な評価は、DDR-NetがRetinaNetや他の同時代のモデルを大きく上回っていることを示している。
これらのイノベーションは、現在の空中画像分析技術を進歩させ、農業、セキュリティ、考古学を含む複数の分野に幅広い影響を与えることを約束する。
関連論文リスト
- Small Object Detection: A Comprehensive Survey on Challenges, Techniques and Real-World Applications [0.15705429611931052]
小型物体検出(SOD)はコンピュータビジョンにおいて重要な課題である。
ディープラーニングの最近の進歩は革新的なソリューションを導入している。
軽量ニューラルネットワーク、知識蒸留(KD)、自己教師型学習といった新興トレンドは、検出効率を改善する上で有望な方向を提供する。
論文 参考訳(メタデータ) (2025-03-26T12:58:13Z) - Edge-AI for Agriculture: Lightweight Vision Models for Disease Detection in Resource-Limited Settings [0.0]
提案システムは,エッジデバイスへの展開に最適化された高度なオブジェクト検出,分類,セグメンテーションモデルを統合する。
本研究は, 精度, 計算効率, 一般化能力に着目し, 各種最先端モデルの性能を評価する。
論文 参考訳(メタデータ) (2024-12-23T06:48:50Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。
トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。
本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文 参考訳(メタデータ) (2024-05-02T19:47:08Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - TII-SSRC-23 Dataset: Typological Exploration of Diverse Traffic Patterns
for Intrusion Detection [0.5261718469769447]
既存のデータセットは、しばしば不足しており、必要な多様性と現在のネットワーク環境との整合性が欠如している。
本稿では,これらの課題を克服するための新しい包括的データセットであるTII-SSRC-23を紹介する。
論文 参考訳(メタデータ) (2023-09-14T05:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。