論文の概要: Towards Resolving the Challenge of Long-tail Distribution in UAV Images
for Object Detection
- arxiv url: http://arxiv.org/abs/2011.03822v1
- Date: Sat, 7 Nov 2020 17:53:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 22:16:03.850406
- Title: Towards Resolving the Challenge of Long-tail Distribution in UAV Images
for Object Detection
- Title(参考訳): 物体検出のためのuav画像におけるロングテール分布の課題解決に向けて
- Authors: Weiping Yu and Taojiannan Yang and Chen Chen
- Abstract要約: UAV画像における既存のオブジェクト検出手法は、UAV画像における不均衡なクラス分布という重要な課題を無視した。
本稿では,UAV画像の長時間分布を解決するための最初の研究であるDual Sampler and Head Detection Network (DSHNet)を提案する。
- 参考スコア(独自算出の注目度): 11.39408884914407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing methods for object detection in UAV images ignored an important
challenge - imbalanced class distribution in UAV images - which leads to poor
performance on tail classes. We systematically investigate existing solutions
to long-tail problems and unveil that re-balancing methods that are effective
on natural image datasets cannot be trivially applied to UAV datasets. To this
end, we rethink long-tailed object detection in UAV images and propose the Dual
Sampler and Head detection Network (DSHNet), which is the first work that aims
to resolve long-tail distribution in UAV images. The key components in DSHNet
include Class-Biased Samplers (CBS) and Bilateral Box Heads (BBH), which are
developed to cope with tail classes and head classes in a dual-path manner.
Without bells and whistles, DSHNet significantly boosts the performance of tail
classes on different detection frameworks. Moreover, DSHNet significantly
outperforms base detectors and generic approaches for long-tail problems on
VisDrone and UAVDT datasets. It achieves new state-of-the-art performance when
combining with image cropping methods. Code is available at
https://github.com/we1pingyu/DSHNet
- Abstract(参考訳): UAV画像における既存のオブジェクト検出手法は、UAV画像における不均衡なクラス分布という重要な課題を無視した。
我々は,既存のロングテール問題の解法を体系的に検討し,自然画像データセットに有効な再バランス手法は,uavデータセットに自明に適用できないことを明らかにした。
この目的のために、UAV画像における長い尾の物体検出を再考し、UAV画像における長い尾の分布を解決することを目的とした最初の研究であるDual Sampler and Head Detection Network (DSHNet)を提案する。
dshnetの重要なコンポーネントは、クラスバイアス・サンプラー(cbs)とバイラテラル・ボックスヘッド(bbh)であり、テールクラスとヘッドクラスをデュアルパスで扱うために開発された。
ベルやホイッスルがなければ、dshnetは異なる検出フレームワークでテールクラスのパフォーマンスを大幅に向上させる。
さらに、DSHNetは、VisDroneとUAVDTデータセットのロングテール問題に対するベース検出器と一般的なアプローチを著しく上回っている。
画像トリミング法と組み合わせることで,新しい最先端性能を実現する。
コードはhttps://github.com/we1pingyu/DSHNetで入手できる。
関連論文リスト
- SCLNet: A Scale-Robust Complementary Learning Network for Object Detection in UAV Images [0.0]
本稿では,SCLNet(Scale-robust complementary learning network)を提案する。
1つの実装は、提案したスケール補完デコーダとスケール補完損失関数に基づいている。
もう一つの実装は、提案したコントラッシブ・コントラスト・コントラスト・コントラスト・コントラスト・ネットワークとコントラスト・コントラスト・コントラスト・コントラスト・コントラスト・ロス関数に基づいている。
論文 参考訳(メタデータ) (2024-09-11T05:39:25Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Raising the Bar of AI-generated Image Detection with CLIP [50.345365081177555]
本研究の目的は、AI生成画像の普遍的検出のための事前学習された視覚言語モデル(VLM)の可能性を探ることである。
我々は,CLIP機能に基づく軽量な検出戦略を開発し,その性能を様々な難易度シナリオで検証する。
論文 参考訳(メタデータ) (2023-11-30T21:11:20Z) - Investigation of UAV Detection in Images with Complex Backgrounds and
Rainy Artifacts [20.20609511526255]
UAV検出のための視覚に基づく物体検出法が開発されている。
複雑な背景と雨のような気象要素を持つ画像におけるUAV検出は、まだ合理的に研究されていない。
この研究は、最先端のオブジェクト検出モデルのベンチマークにも重点を置いている。
論文 参考訳(メタデータ) (2023-05-25T19:54:33Z) - DETA: Denoised Task Adaptation for Few-Shot Learning [135.96805271128645]
数ショット学習におけるテスト時間タスク適応は、訓練済みのタスク非依存モデルに適応してタスク固有の知識を取得することを目的としている。
少数のサンプルしか得られないため、支持試料からのイメージノイズ(Xノイズ)またはラベルノイズ(Yノイズ)の悪影響を著しく増幅することができる。
Denoized Task Adaptation (DETA) は、既存のタスク適応アプローチに対して、最初に統合された画像とラベルをデノベートするフレームワークである。
論文 参考訳(メタデータ) (2023-03-11T05:23:20Z) - Inverse Image Frequency for Long-tailed Image Recognition [59.40098825416675]
Inverse Image Frequency (IIF) と呼ばれる新しいデバイアス法を提案する。
IIFは畳み込みニューラルネットワークの分類層におけるロジットの乗法的マージン調整変換である。
我々の実験では、IIFは長い尾のベンチマークにおいて、最先端の技術を超越していることが示されている。
論文 参考訳(メタデータ) (2022-09-11T13:31:43Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - SyNet: An Ensemble Network for Object Detection in UAV Images [13.198689566654107]
本稿では,マルチステージ方式とシングルステージ方式を組み合わせたアンサンブルネットワークであるSyNetを提案する。
ビルディングブロックとして、センシング戦略とともに、プリトレーニング特徴抽出器を備えたセンタネットおよびカスケードr−cnnを利用する。
提案手法により得られた技術成果を2つの異なるデータセットで報告する。
論文 参考訳(メタデータ) (2020-12-23T21:38:32Z) - Decoupled Self Attention for Accurate One Stage Object Detection [4.791635488070342]
本稿では,1段階の物体検出モデルに対してデカップリング自己注意(DSA)モジュールを提案する。
DSAモジュールのネットワークは単純だが、オブジェクト検出の性能を効果的に向上させることができるが、多くの検出モデルに組み込むこともできる。
論文 参考訳(メタデータ) (2020-12-14T15:19:30Z) - Overcoming Classifier Imbalance for Long-tail Object Detection with
Balanced Group Softmax [88.11979569564427]
本報告では, 長期分布前における最先端モデルの過小評価に関する最初の体系的解析を行う。
本稿では,グループワイドトレーニングを通じて検出フレームワーク内の分類器のバランスをとるための,新しいバランス付きグループソフトマックス(BAGS)モジュールを提案する。
非常に最近の長尾大語彙オブジェクト認識ベンチマークLVISの大規模な実験により,提案したBAGSは検出器の性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-06-18T10:24:26Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。