論文の概要: Small Bird Detection using YOLOv7 with Test-Time Augmentation
- arxiv url: http://arxiv.org/abs/2401.01018v1
- Date: Fri, 15 Dec 2023 00:11:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 10:06:21.896666
- Title: Small Bird Detection using YOLOv7 with Test-Time Augmentation
- Title(参考訳): テスト時間拡張によるYOLOv7による小鳥検出
- Authors: Kosuke Shigematsu
- Abstract要約: 本研究では,スポッティングバード2023の小型物体検出問題に対する小鳥検出の改良を目的とした手法を提案する。
提案手法では,入力解像度の向上,マルチスケール推論の導入,推論プロセス中のフリップ画像の考察,重み付きボックス融合による検出結果のマージを行う。
IoU=0.5でパブリックAPが0.732、プライベートAPが27.2であった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a method specifically aimed at improving small bird
detection for the Small Object Detection Challenge for Spotting Birds 2023.
Utilizing YOLOv7 model with test-time augmentation, our approach involves
increasing the input resolution, incorporating multiscale inference,
considering flipped images during the inference process, and employing weighted
boxes fusion to merge detection results. We rigorously explore the impact of
each technique on detection performance. Experimental results demonstrate
significant improvements in detection accuracy. Our method achieved a top score
in the Development category, with a public AP of 0.732 and a private AP of
27.2, both at IoU=0.5.
- Abstract(参考訳): 本稿では,スポッティングバード2023の小型物体検出問題に対する小鳥検出の改良を目的とした手法を提案する。
テスト時間拡張を伴うyolov7モデルを利用することで、入力解像度の向上、マルチスケール推論の導入、推論プロセス中のフリップイメージの考慮、重み付きボックス融合による検出結果のマージなどを行う。
我々は,各手法が検出性能に与える影響を厳格に検討する。
実験により検出精度が大幅に向上した。
本手法は開発カテゴリで0.732のパブリックapと27.2のプライベートapをそれぞれ0.5のiou=0.5で達成した。
関連論文リスト
- YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0]
無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。
本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。
高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文 参考訳(メタデータ) (2024-10-15T16:00:01Z) - DASSF: Dynamic-Attention Scale-Sequence Fusion for Aerial Object Detection [6.635903943457569]
元のYOLOアルゴリズムは、異なるスケールのターゲットを認識する能力の弱いため、全体的な検出精度が低い。
本稿では,空中画像のターゲット検出のための動的アテンションスケール系列融合アルゴリズム(DASSF)を提案する。
DASSF法をYOLOv8nと比較すると,平均平均精度(mAP)は9.2%,2.4%増加した。
論文 参考訳(メタデータ) (2024-06-18T05:26:44Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Joint-YODNet: A Light-weight Object Detector for UAVs to Achieve Above
100fps [2.5761958263376745]
小型物体を検知するためのUAVのためのJointYODNetという新しい手法を提案する。
本手法は, 小型物体の検出性能を高めるため, 接合損失関数の開発を中心に展開する。
その結果,提案した関節損失関数は,小さな物体を正確に位置決めする既存の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-09-27T16:57:04Z) - An Effective Two-stage Training Paradigm Detector for Small Dataset [13.227589864946477]
YOLOv8のバックボーンはマスク画像モデリング技術を用いてエンコーダとして事前訓練されている。
テスト段階では、各モデルを強化するためにテスト時間拡張(TTA)が使用され、さらに性能を高めるために重み付きボックス融合(WBF)が実装される。
良く設計された構造で、私たちのアプローチはDelftBikesテストセットで0.50から0.95までの平均精度を30.4%達成し、リーダーボードで4位になった。
論文 参考訳(メタデータ) (2023-09-11T17:43:11Z) - Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。
OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。
我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文 参考訳(メタデータ) (2022-12-26T12:49:47Z) - ERNIE-SPARSE: Learning Hierarchical Efficient Transformer Through
Regularized Self-Attention [48.697458429460184]
情報ボトルネック感度と異なる注目トポロジ間の不整合の2つの要因がスパース変換器の性能に影響を及ぼす可能性がある。
本稿では,ERNIE-Sparseというモデルを提案する。
i) 局所情報とグローバル情報を逐次統一する階層スパース変換器(HST) と、(ii) 注意トポロジの異なる変換器の距離を最小化する自己注意正規化(SAR) の2つの特徴がある。
論文 参考訳(メタデータ) (2022-03-23T08:47:01Z) - Analysis and Adaptation of YOLOv4 for Object Detection in Aerial Images [0.0]
本研究は,空中画像中の物体とその位置を予測するためのYOLOv4フレームワークの適応性を示す。
トレーニングされたモデルは平均的な平均精度(mAP)が45.64%となり、推論速度はTesla K80 GPUで8.7FPSに達した。
いくつかの現代の空中物体検出器との比較研究により、YOLOv4はより優れた性能を示し、航空プラットフォームに組み込むのにより適した検出アルゴリズムが示唆された。
論文 参考訳(メタデータ) (2022-03-18T23:51:09Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。