論文の概要: OGMN: Occlusion-guided Multi-task Network for Object Detection in UAV
Images
- arxiv url: http://arxiv.org/abs/2304.11805v1
- Date: Mon, 24 Apr 2023 03:30:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 16:17:50.708856
- Title: OGMN: Occlusion-guided Multi-task Network for Object Detection in UAV
Images
- Title(参考訳): ogmn:uav画像における物体検出のための咬合誘導マルチタスクネットワーク
- Authors: Xuexue Li, Wenhui Diao, Yongqiang Mao, Peng Gao, Xiuhua Mao, Xinming
Li and Xian Sun
- Abstract要約: 物体間の衝突は、UAV画像における物体検出の課題の1つである。
本稿では,OGMN(Occclusion-guided Multi-task Network)を提案する。
我々のOGMNは、Visdroneデータセットで35.0% mAPを獲得し、ベースラインを5.3%上回っている。
- 参考スコア(独自算出の注目度): 13.90359920041577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occlusion between objects is one of the overlooked challenges for object
detection in UAV images. Due to the variable altitude and angle of UAVs,
occlusion in UAV images happens more frequently than that in natural scenes.
Compared to occlusion in natural scene images, occlusion in UAV images happens
with feature confusion problem and local aggregation characteristic. And we
found that extracting or localizing occlusion between objects is beneficial for
the detector to address this challenge. According to this finding, the
occlusion localization task is introduced, which together with the object
detection task constitutes our occlusion-guided multi-task network (OGMN). The
OGMN contains the localization of occlusion and two occlusion-guided multi-task
interactions. In detail, an occlusion estimation module (OEM) is proposed to
precisely localize occlusion. Then the OGMN utilizes the occlusion localization
results to implement occlusion-guided detection with two multi-task
interactions. One interaction for the guide is between two task decoders to
address the feature confusion problem, and an occlusion decoupling head (ODH)
is proposed to replace the general detection head. Another interaction for
guide is designed in the detection process according to local aggregation
characteristic, and a two-phase progressive refinement process (TPP) is
proposed to optimize the detection process. Extensive experiments demonstrate
the effectiveness of our OGMN on the Visdrone and UAVDT datasets. In
particular, our OGMN achieves 35.0% mAP on the Visdrone dataset and outperforms
the baseline by 5.3%. And our OGMN provides a new insight for accurate
occlusion localization and achieves competitive detection performance.
- Abstract(参考訳): 物体間の衝突は、UAV画像における物体検出の課題の1つである。
UAVの高度と角度の変動により、UAV画像の閉塞は自然の場面よりも頻繁に起こる。
自然のシーン画像の閉塞と比較して、UAV画像の閉塞は特徴的混乱問題と局所的な凝集特性を伴う。
その結果,物体間の咬合の抽出や局所化は,検出者がこの問題に取り組む上で有用であることがわかった。
この結果から, 対象検出タスクと合わせてオクルージョン誘導マルチタスクネットワーク(ogmn)を構成するオクルージョン局在化タスクが導入された。
OGMNはオクルージョンの局在と2つのオクルージョン誘導マルチタスク相互作用を含んでいる。
詳しくは、オクルージョン推定モジュール(OEM)を提案し、オクルージョンを正確にローカライズする。
次に、ogmnは2つのマルチタスクインタラクションによる咬合誘導検出を実現するために咬合定位結果を利用する。
このガイドの1つの相互作用は、2つのタスクデコーダの間で特徴混乱問題に対処し、一般的な検出ヘッドを置き換えるためにオクルージョンデカップリングヘッド(ODH)を提案することである。
また, 局所凝集特性による検出過程において, ガイドの別の相互作用を設計し, 検出過程を最適化するために2相進行処理(TPP)を提案する。
visdroneおよびuavdtデータセットに対する我々のogmnの有効性を広範な実験により実証した。
特に、我々のOGMNは、Visdroneデータセットで35.0% mAPを獲得し、ベースラインを5.3%上回っている。
また,我々のogmnは正確な咬合定位に関する新たな知見を提供し,競合検出性能を実現する。
関連論文リスト
- DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Multiple Object Tracking based on Occlusion-Aware Embedding Consistency
Learning [46.726678333518066]
Occlusion Prediction Module (OPM)とOcclusion-Aware Association Module (OAAM)
OPMは、真の検出毎に閉塞情報を予測し、トラックの視覚埋め込みの一貫性学習のための有効なサンプルの選択を容易にする。
OAAMは各トラックに対して2つの別々の埋め込みを生成し、非閉塞検出と非閉塞検出の両方で一貫性を保証する。
論文 参考訳(メタデータ) (2023-11-05T06:08:58Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - OccluTrack: Rethinking Awareness of Occlusion for Enhancing Multiple
Pedestrian Tracking [7.964206483424679]
既存の手法では, 閉塞による不正確な動作推定, 外観特徴抽出, 関連性に悩まされている。
本研究は, 明瞭な動作推定, 信頼性のある外観特徴, 閉塞シーンにおける公正な関連性について考察する。
具体的には,アダプティブ・オクルージョンを意識した複数歩行者トラッカーOccluTrackを提案する。
論文 参考訳(メタデータ) (2023-09-19T06:43:18Z) - Occlusion-Aware Detection and Re-ID Calibrated Network for Multi-Object
Tracking [38.36872739816151]
検出器内のOAA(Occlusion-Aware Attention)モジュールは、隠蔽された背景領域を抑えながらオブジェクトの特徴を強調する。
OAAは、隠蔽される可能性のある物体の検出器を強化する変調器として機能する。
最適輸送問題に基づくRe-ID埋め込みマッチングブロックを設計する。
論文 参考訳(メタデータ) (2023-08-30T06:56:53Z) - Object Semantics Give Us the Depth We Need: Multi-task Approach to
Aerial Depth Completion [1.2239546747355885]
本稿では,2つのタスクをひとつのパスで共同実行するための新しい手法を提案する。
提案手法は,2つのタスクを共同学習機能に公開するエンコーダに着目したマルチタスク学習モデルに基づく。
実験の結果,提案したマルチタスクネットワークはシングルタスクネットワークよりも優れていた。
論文 参考訳(メタデータ) (2023-04-25T03:21:32Z) - Threatening Patch Attacks on Object Detection in Optical Remote Sensing
Images [55.09446477517365]
自然画像における物体検出における高度なパッチアタック(PA)は、ディープニューラルネットワークに基づく手法における大きな安全性の脆弱性を指摘した。
我々は,TPAと呼ばれる視覚的品質の低下を伴わない,より危険度の高いPAを提案する。
我々の知る限りでは、これがO-RSIにおけるオブジェクト検出におけるPAの研究の最初の試みであり、この研究が読者にこのトピックの研究に興味を持たせることを願っている。
論文 参考訳(メタデータ) (2023-02-13T02:35:49Z) - Detecting Adversarial Perturbations in Multi-Task Perception [32.9951531295576]
本稿では,複雑な視覚タスクのマルチタスク認識に基づく,新たな対向摂動検出手法を提案する。
入力画像の抽出されたエッジと深度出力とセグメンテーション出力との不整合により、逆摂動を検出する。
5%の偽陽性率を仮定すると、画像の最大100%は逆摂動として正しく検出され、摂動の強さに依存する。
論文 参考訳(メタデータ) (2022-03-02T15:25:17Z) - SEA: Bridging the Gap Between One- and Two-stage Detector Distillation
via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。
1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文 参考訳(メタデータ) (2022-03-02T04:24:05Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。