Fugu-MT 論文翻訳(概要): Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images

論文の概要: Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images

arxiv url: http://arxiv.org/abs/2112.06701v1
Date: Mon, 13 Dec 2021 14:37:20 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-14 22:04:13.816829
Title: Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images
Title（参考訳）: 空中画像におけるロバスト物体検出のためのモデルインタラクションによるアンカーリタッチ
Authors: Dong Liang, Qixiang Geng, Zongqi Wei, Dmitry A. Vorontsov, Ekaterina L. Kim, Mingqiang Wei and Huiyu Zhou
Abstract要約: 本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
参考スコア（独自算出の注目度）: 15.404024559652534
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Object detection has made tremendous strides in computer vision. Small object detection with appearance degradation is a prominent challenge, especially for aerial observations. To collect sufficient positive/negative samples for heuristic training, most object detectors preset region anchors in order to calculate Intersection-over-Union (IoU) against the ground-truthed data. In this case, small objects are frequently abandoned or mislabeled. In this paper, we present an effective Dynamic Enhancement Anchor (DEA) network to construct a novel training sample generator. Different from the other state-of-the-art techniques, the proposed network leverages a sample discriminator to realize interactive sample screening between an anchor-based unit and an anchor-free unit to generate eligible samples. Besides, multi-task joint training with a conservative anchor-based inference scheme enhances the performance of the proposed model while reducing computational complexity. The proposed scheme supports both oriented and horizontal object detection tasks. Extensive experiments on two challenging aerial benchmarks (i.e., DOTA and HRSC2016) indicate that our method achieves state-of-the-art performance in accuracy with moderate inference speed and computational overhead for training. On DOTA, our DEA-Net which integrated with the baseline of RoI-Transformer surpasses the advanced method by 0.40% mean-Average-Precision (mAP) for oriented object detection with a weaker backbone network (ResNet-101 vs ResNet-152) and 3.08% mean-Average-Precision (mAP) for horizontal object detection with the same backbone. Besides, our DEA-Net which integrated with the baseline of ReDet achieves the state-of-the-art performance by 80.37%. On HRSC2016, it surpasses the previous best model by 1.1% using only 3 horizontal anchors.
Abstract（参考訳）: 物体検出はコンピュータビジョンにおいて大きな進歩を遂げた。外観劣化を伴う小型物体検出は、特に空中観測において顕著な課題である。ヒューリスティックトレーニングのための十分な正・負のサンプルを収集するために、ほとんどの物体検出器は、接地されたデータに対してIoU(Intersection-over-Union)を計算するために領域アンカーをプリセットする。この場合、小さな物体はしばしば放棄されるか、誤記される。本稿では,新しいトレーニングサンプル生成装置を構築するために,動的拡張アンカー(DEA)ネットワークを提案する。他の最先端技術とは違って,本ネットワークでは,アンカーベースユニットとアンカーフリーユニットとの対話型サンプルスクリーニングを実現するために,サンプル判別器を利用する。さらに、保守的なアンカーベース推論スキームを用いたマルチタスク共同トレーニングにより、計算複雑性を低減しつつ、提案モデルの性能を向上させる。提案手法はオブジェクト指向と水平物体検出の両方をサポートする。 2つの挑戦的航空ベンチマーク(DOTAとHRSC2016)の大規模な実験は、我々の手法が適度な推論速度と訓練のための計算オーバーヘッドで精度良く最先端の性能を達成することを示唆している。 DOTAでは、RoI-Transformerのベースラインと統合したDEA-Netが、より弱いバックボーンネットワーク(ResNet-101 vs ResNet-152)によるオブジェクト指向オブジェクト検出のための平均精度(mAP)と、同じバックボーンによる水平オブジェクト検出のための平均精度(mAP)を0.40%上回っている。さらに,ReDetのベースラインと統合したDEA-Netでは,最先端のパフォーマンスが80.37%向上した。 hrsc2016では、従来のベストモデルを1.1%上回り、水平アンカーは3つしかない。

関連論文リスト

IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文参考訳（メタデータ） (2026-03-03T14:36:46Z)
Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文参考訳（メタデータ） (2025-01-29T20:39:16Z)
PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection [65.84604846389624]
我々は,より強力な単一点制御OODフレームワークであるPointOBB-v3を提案する。追加のプリミティブなしで擬似回転ボックスを生成し、エンドツーエンドのパラダイムをサポートする。本手法は従来の最先端手法と比較して3.56%の精度向上を実現している。
論文参考訳（メタデータ） (2025-01-23T18:18:15Z)
Efficient Oriented Object Detection with Enhanced Small Object Recognition in Aerial Images [2.9138705529771123]
本稿では,オブジェクト指向物体検出タスクに適したYOLOv8モデルを新たに拡張する。本モデルでは,ASFP(Adaptive Scale Feature Pyramid)モジュールと,P2層の詳細を利用したウェーブレット変換に基づくC2fモジュールを特徴とする。我々のアプローチは233万のパラメータを持つDecoupleNetよりも効率的なアーキテクチャ設計を提供し、検出精度を維持しています。
論文参考訳（メタデータ） (2024-12-17T05:45:48Z)
SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (2024-07-01T07:03:51Z)
Scale-Invariant Feature Disentanglement via Adversarial Learning for UAV-based Object Detection [18.11107031800982]
本稿では,スケール不変の特徴を学習することで,単段階推論の精度を向上させることを提案する。 3つのベンチマークデータセット上で、最先端の3つの軽量検出フレームワークに適用する。
論文参考訳（メタデータ） (2024-05-24T11:40:22Z)
Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文参考訳（メタデータ） (2024-05-17T04:37:44Z)
PointOBB: Learning Oriented Object Detection via Single Point Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。 PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。 DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文参考訳（メタデータ） (2023-11-23T15:51:50Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。 CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文参考訳（メタデータ） (2023-08-18T13:13:09Z)
Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文参考訳（メタデータ） (2021-07-07T00:52:16Z)
CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文参考訳（メタデータ） (2021-01-18T02:31:09Z)
Dynamic Anchor Learning for Arbitrary-Oriented Object Detection [4.247967690041766]
任意指向オブジェクトは、自然のシーン、空中写真、リモートセンシング画像などに広く現れる。現在の回転検出器は、異なる向きのアンカーをたくさん使用して、地上の真実ボックスとの空間アライメントを実現します。新たに定義されたマッチング度を利用した動的アンカー学習(DAL)法を提案する。
論文参考訳（メタデータ） (2020-12-08T01:30:06Z)
One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文参考訳（メタデータ） (2020-05-08T01:59:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。