論文の概要: Improvement and Enhancement of YOLOv5 Small Target Recognition Based on
Multi-module Optimization
- arxiv url: http://arxiv.org/abs/2310.01806v1
- Date: Tue, 3 Oct 2023 05:39:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 17:34:33.293487
- Title: Improvement and Enhancement of YOLOv5 Small Target Recognition Based on
Multi-module Optimization
- Title(参考訳): マルチモジュール最適化に基づくYOLOv5小型目標認識の改良と向上
- Authors: Qingyang Li and Yuchen Li and Hongyi Duan and JiaLiang Kang and Jianan
Zhang and Xueqian Gan and Ruotong Xu
- Abstract要約: モデルの性能は、GhostNetベースの畳み込みモジュール、RepGFPNベースのネックモジュール最適化、CAとTransformerのアテンション機構、NWDによる損失関数の改善によって向上した。
改善されたモデルは、現実世界のアプリケーションテストにおいて、複雑なバックグラウンドと小さなターゲットを扱う上で、大きな優位性を示している。
- 参考スコア(独自算出の注目度): 9.125818713673366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the limitations of YOLOv5s model on small target detection
task are deeply studied and improved. The performance of the model is
successfully enhanced by introducing GhostNet-based convolutional module,
RepGFPN-based Neck module optimization, CA and Transformer's attention
mechanism, and loss function improvement using NWD. The experimental results
validate the positive impact of these improvement strategies on model
precision, recall and mAP. In particular, the improved model shows significant
superiority in dealing with complex backgrounds and tiny targets in real-world
application tests. This study provides an effective optimization strategy for
the YOLOv5s model on small target detection, and lays a solid foundation for
future related research and applications.
- Abstract(参考訳): 本稿では,小型目標検出タスクにおけるYOLOv5sモデルの限界を深く研究・改善する。
モデルの性能は、GhostNetベースの畳み込みモジュール、RepGFPNベースのネックモジュール最適化、CAとTransformerのアテンション機構、NWDによる損失関数の改善によって向上した。
実験により, これらの改善策がモデル精度, リコール, mAPに与える影響を検証した。
特に、改善されたモデルは、現実世界のアプリケーションテストにおいて、複雑なバックグラウンドと小さなターゲットを扱う上で、大きな優位性を示している。
本研究は,小型目標検出におけるYOLOv5sモデルの効果的な最適化戦略を提供し,今後の研究・応用の基盤となる。
関連論文リスト
- Spatial Transformer Network YOLO Model for Agricultural Object Detection [0.3124884279860061]
本稿では,空間変換器ネットワーク(STN)をYOLOに統合し,性能を向上させる手法を提案する。
提案するSTN-YOLOは,画像の重要な領域に着目し,モデルの有効性を高めることを目的としている。
農業オブジェクト検出のためのベンチマークデータセットと、最先端の植物表現型温室施設からの新たなデータセットにSTN-YOLOを適用した。
論文 参考訳(メタデータ) (2024-07-31T14:53:41Z) - YOLOv5, YOLOv8 and YOLOv10: The Go-To Detectors for Real-time Vision [0.6662800021628277]
本稿では、YOLOv5, YOLOv8, YOLOv10に着目し、YOLO(You Only Look Once)オブジェクト検出アルゴリズムの進化に焦点を当てた。
これらのバージョンにまたがるエッジデプロイメントのアーキテクチャの進歩、パフォーマンスの改善、適合性を分析します。
論文 参考訳(メタデータ) (2024-07-03T10:40:20Z) - Precision and Adaptability of YOLOv5 and YOLOv8 in Dynamic Robotic Environments [0.0]
本研究は, YOLOv5モデルとYOLOv8モデルの比較分析を行った。
初期の期待とは対照的に、YOLOv5モデルは同等で、場合によってはオブジェクト検出タスクの精度が優れていた。
論文 参考訳(メタデータ) (2024-06-01T06:17:43Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Simplifying Model-based RL: Learning Representations, Latent-space
Models, and Policies with One Objective [142.36200080384145]
自己整合性を維持しつつ高いリターンを達成するために,潜在空間モデルとポリシーを協調的に最適化する単一目的を提案する。
得られたアルゴリズムは, モデルベースおよびモデルフリーRL手法のサンプル効率に適合するか, 改善することを示した。
論文 参考訳(メタデータ) (2022-09-18T03:51:58Z) - YOLOv5s-GTB: light-weighted and improved YOLOv5s for bridge crack
detection [0.0]
本研究は,モバイルデバイスのシナリオに展開可能な,軽量,高精度,深層学習に基づく橋梁明瞭き裂認識モデルを提案する。
YOLOv5は、比較と検証のための実験を通じて、軽量き裂検出モデルの基本的なフレームワークとして同定されている。
改良されたモデルではパラメータが42%減少し,推論応答が高速になった。
論文 参考訳(メタデータ) (2022-06-03T10:52:59Z) - MapGo: Model-Assisted Policy Optimization for Goal-Oriented Tasks [37.529217646431825]
目標志向の強化学習では、過去の経験から生の目標を緩和して、エージェントに後見能力を提供することが、報酬空間の問題に対する主要な解決策である。
FGI(Foresight Goal Inference)は、学習されたダイナミックスモデルで未来を見据えて、目標をリラベルする新しいラベリング戦略である。
サンプル効率を向上させるため,政策学習のためのシミュレーション軌道を生成するために動的モデルを提案する。
論文 参考訳(メタデータ) (2021-05-13T15:07:23Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。