Fugu-MT 論文翻訳(概要): SyNet: An Ensemble Network for Object Detection in UAV Images

論文の概要: SyNet: An Ensemble Network for Object Detection in UAV Images

arxiv url: http://arxiv.org/abs/2012.12991v1
Date: Wed, 23 Dec 2020 21:38:32 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-25 20:05:52.635703
Title: SyNet: An Ensemble Network for Object Detection in UAV Images
Title（参考訳）: SyNet:UAV画像におけるオブジェクト検出のためのアンサンブルネットワーク
Authors: Berat Mert Albaba, Sedat Ozer
Abstract要約: 本稿では,マルチステージ方式とシングルステージ方式を組み合わせたアンサンブルネットワークであるSyNetを提案する。ビルディングブロックとして、センシング戦略とともに、プリトレーニング特徴抽出器を備えたセンタネットおよびカスケードr−cnnを利用する。提案手法により得られた技術成果を2つの異なるデータセットで報告する。
参考スコア（独自算出の注目度）: 13.198689566654107
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in camera equipped drone applications and their widespread use increased the demand on vision based object detection algorithms for aerial images. Object detection process is inherently a challenging task as a generic computer vision problem, however, since the use of object detection algorithms on UAVs (or on drones) is relatively a new area, it remains as a more challenging problem to detect objects in aerial images. There are several reasons for that including: (i) the lack of large drone datasets including large object variance, (ii) the large orientation and scale variance in drone images when compared to the ground images, and (iii) the difference in texture and shape features between the ground and the aerial images. Deep learning based object detection algorithms can be classified under two main categories: (a) single-stage detectors and (b) multi-stage detectors. Both single-stage and multi-stage solutions have their advantages and disadvantages over each other. However, a technique to combine the good sides of each of those solutions could yield even a stronger solution than each of those solutions individually. In this paper, we propose an ensemble network, SyNet, that combines a multi-stage method with a single-stage one with the motivation of decreasing the high false negative rate of multi-stage detectors and increasing the quality of the single-stage detector proposals. As building blocks, CenterNet and Cascade R-CNN with pretrained feature extractors are utilized along with an ensembling strategy. We report the state of the art results obtained by our proposed solution on two different datasets: namely MS-COCO and visDrone with \%52.1 $mAP_{IoU = 0.75}$ is obtained on MS-COCO $val2017$ dataset and \%26.2 $mAP_{IoU = 0.75}$ is obtained on VisDrone $test-set$.
Abstract（参考訳）: カメラ搭載ドローンの最近の進歩と普及により、航空画像に対する視覚に基づく物体検出アルゴリズムの需要が高まった。物体検出プロセスは、本質的には汎用的なコンピュータビジョン問題としての課題であるが、uav(またはドローン)での物体検出アルゴリズムの使用は、比較的新しい領域であるため、航空画像中の物体を検出するためのより困難な問題として残されている。 i)大きな物体のばらつきを含む大規模なドローンデータセットの欠如、(ii)地上画像と比較してドローン画像の大きな向きとスケールのばらつき、(iii)地上画像と空中画像のテクスチャと形状の特徴の違いなど、いくつかの理由がある。ディープラーニングに基づく物体検出アルゴリズムは、(a)単段検出器と(b)多段検出器の2つの主要なカテゴリに分類される。シングルステージソリューションとマルチステージソリューションはどちらも、それぞれに長所と短所がある。しかし、これらの解の良辺を結合する手法は、それぞれの解よりも強い解を個々に得ることができる。本稿では,多段方式と単段方式を組み合わせたアンサンブルネットワークであるsynetを提案する。ビルディングブロックとして、事前訓練された特徴抽出器を備えたCenterNetとCascade R-CNNをアンサンブル戦略と共に利用する。提案手法によって得られた2つの異なるデータセット、すなわち、mAP_{IoU = 0.75}$がMS-COCO $val2017$データセットで得られ、mAP_{IoU = 0.75}$がVisDrone $test-set$で得られる。

関連論文リスト

Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文参考訳（メタデータ） (2025-01-29T20:39:16Z)
SCLNet: A Scale-Robust Complementary Learning Network for Object Detection in UAV Images [0.0]
本稿では,SCLNet(Scale-robust complementary learning network)を提案する。 1つの実装は、提案したスケール補完デコーダとスケール補完損失関数に基づいている。もう一つの実装は、提案したコントラッシブ・コントラスト・コントラスト・コントラスト・コントラスト・ネットワークとコントラスト・コントラスト・コントラスト・コントラスト・コントラスト・ロス関数に基づいている。
論文参考訳（メタデータ） (2024-09-11T05:39:25Z)
Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。 KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。 RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文参考訳（メタデータ） (2024-09-09T13:56:22Z)
SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (2024-07-01T07:03:51Z)
YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.80392696735718]
YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。 Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文参考訳（メタデータ） (2024-04-09T10:03:44Z)
Multi-Stage Fusion Architecture for Small-Drone Localization and Identification Using Passive RF and EO Imagery: A Case Study [0.1872664641238533]
本研究では、受動無線周波数(RF)と電気光学(EO)画像データを用いた多段階融合アーキテクチャを開発する。教師なしの深層学習に基づく手法と、教師なしの地上/後方分離手法を探索し、挑戦的な環境に対処する。提案した融合アーキテクチャを検証し,その範囲で追跡性能を定量化する。
論文参考訳（メタデータ） (2024-03-30T22:53:28Z)
Uncertainty Aware Multitask Pyramid Vision Transformer For UAV-Based Object Re-Identification [38.19907319079833]
UAVベースのオブジェクトReIDのバックボーンとして、畳み込みのない新しいマルチスケールアーキテクチャであるPraamid Vision Transformer(PVT)を用いるマルチタスク学習手法を提案する。クラス内変動の不確実性モデリングにより、不確実性認識オブジェクトIDとカメラID情報の両方を用いて、提案手法を協調的に最適化することができる。
論文参考訳（メタデータ） (2022-09-19T00:27:07Z)
Enhanced Single-shot Detector for Small Object Detection in Remote Sensing Images [33.84369068593722]
小型物体検出のための画像ピラミッド単発検出器(IPSSD)を提案する。 IPSSDでは、単一ショット検出器と画像ピラミッドネットワークを組み合わせて、候補領域を生成するための意味的に強い特徴を抽出する。提案するネットワークは,特徴ピラミッドネットワークから小規模な特徴を拡張できる。
論文参考訳（メタデータ） (2022-05-12T07:35:07Z)
Target-aware Dual Adversarial Learning and a Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文参考訳（メタデータ） (2022-03-30T11:44:56Z)
One-Shot Object Affordance Detection in the Wild [76.46484684007706]
Affordance Detectionは、画像内のオブジェクトの潜在的なアクション可能性を特定することを指す。我々は、人間の行動目的を推定し、それを転送して、すべての候補画像から共通価格を検出するワンショットアフォーダンス検出ネットワーク(OSAD-Net)を考案する。複雑なシーンと豊富なアノテーションによって、当社のPADv2データセットは、アベイランス検出メソッドをベンチマークするためのテストベッドとして使用することができます。
論文参考訳（メタデータ） (2021-08-08T14:53:10Z)
MRDet: A Multi-Head Network for Accurate Oriented Object Detection in Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文参考訳（メタデータ） (2020-12-24T06:36:48Z)
Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文参考訳（メタデータ） (2020-08-19T13:13:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。