論文の概要: Dynamic Refinement Network for Oriented and Densely Packed Object
Detection
- arxiv url: http://arxiv.org/abs/2005.09973v2
- Date: Wed, 10 Jun 2020 23:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 05:40:38.604754
- Title: Dynamic Refinement Network for Oriented and Densely Packed Object
Detection
- Title(参考訳): 配向・密集物体検出のための動的細粒化ネットワーク
- Authors: Xingjia Pan, Yuqiang Ren, Kekai Sheng, Weiming Dong, Haolei Yuan,
Xiaowei Guo, Chongyang Ma, Changsheng Xu
- Abstract要約: 本稿では,機能選択モジュール (FSM) と動的改善ヘッド (DRH) の2つの新しいコンポーネントからなる動的精細化ネットワークを提案する。
我々のFSMは、ニューロンがターゲットオブジェクトの形状や向きに応じて受容野を調整できるのに対して、DRHはオブジェクト認識の方法で動的に予測を洗練させる。
我々は、DOTA、HRSC2016、SKU110K、および我々のSKU110K-Rデータセットを含むいくつかの公開ベンチマークで定量的評価を行う。
- 参考スコア(独自算出の注目度): 75.29088991850958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection has achieved remarkable progress in the past decade.
However, the detection of oriented and densely packed objects remains
challenging because of following inherent reasons: (1) receptive fields of
neurons are all axis-aligned and of the same shape, whereas objects are usually
of diverse shapes and align along various directions; (2) detection models are
typically trained with generic knowledge and may not generalize well to handle
specific objects at test time; (3) the limited dataset hinders the development
on this task. To resolve the first two issues, we present a dynamic refinement
network that consists of two novel components, i.e., a feature selection module
(FSM) and a dynamic refinement head (DRH). Our FSM enables neurons to adjust
receptive fields in accordance with the shapes and orientations of target
objects, whereas the DRH empowers our model to refine the prediction
dynamically in an object-aware manner. To address the limited availability of
related benchmarks, we collect an extensive and fully annotated dataset,
namely, SKU110K-R, which is relabeled with oriented bounding boxes based on
SKU110K. We perform quantitative evaluations on several publicly available
benchmarks including DOTA, HRSC2016, SKU110K, and our own SKU110K-R dataset.
Experimental results show that our method achieves consistent and substantial
gains compared with baseline approaches. The code and dataset are available at
https://github.com/Anymake/DRN_CVPR2020.
- Abstract(参考訳): 物体検出は過去10年で顕著な進歩を遂げた。
しかし,(1) ニューロンの受容野がすべて軸方向で同じ形状をしているのに対して,(2) 対象は多種多様な形状をしており,様々な方向に沿って配列している; (2) 検出モデルは一般的に一般的な知識で訓練されており,テスト時に特定の対象を扱うためにうまく一般化できない; (3) 限られたデータセットは,このタスクの開発を妨げる。
最初の2つの問題を解決するために,機能選択モジュール (FSM) と動的改善ヘッド (DRH) という2つの新しいコンポーネントからなる動的改良ネットワークを提案する。
我々のFSMは、ニューロンがターゲットオブジェクトの形状や向きに応じて受容野を調整できるのに対して、DRHはオブジェクト認識の方法で動的に予測を洗練させる。
関連するベンチマークの可用性の制限に対処するため,SKU110K-Rという,SKU110Kに基づく有向境界ボックスを組み込んだ,広範かつ完全な注釈付きデータセットを収集する。
我々は、DOTA、HRSC2016、SKU110K、および我々のSKU110K-Rデータセットを含むいくつかの公開ベンチマークで定量的評価を行う。
実験の結果,本手法はベースライン手法と比較して,一貫性と実質的な向上が得られた。
コードとデータセットはhttps://github.com/Anymake/DRN_CVPR2020で公開されている。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - Zero-Shot Refinement of Buildings' Segmentation Models using SAM [6.110856077714895]
本稿では,既存モデルの一般化損失に対処するために基礎モデルを適用する新しいアプローチを提案する。
いくつかのモデルの中で、私たちはSegment Anything Model(SAM)に焦点を当てています。
SAMは認識機能を提供しないので、ローカライズされたオブジェクトの分類とタグ付けに失敗する。
この新しいアプローチはSAMを認識能力で強化する。
論文 参考訳(メタデータ) (2023-10-03T07:19:59Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - D2Q-DETR: Decoupling and Dynamic Queries for Oriented Object Detection
with Transformers [14.488821968433834]
オブジェクト指向オブジェクト検出のためのエンドツーエンドフレームワークを提案する。
我々のフレームワークはDETRに基づいており、ボックスレグレッションヘッドはポイント予測ヘッドに置き換えられている。
最大かつ挑戦的なDOTA-v1.0データセットとDOTA-v1.5データセットの実験は、D2Q-DETRが既存のNMSベースおよびNMSのないオブジェクト指向オブジェクト検出方法より優れていることを示している。
論文 参考訳(メタデータ) (2023-03-01T14:36:19Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z) - Extended Target Tracking and Classification Using Neural Networks [1.2891210250935146]
最先端のETTアルゴリズムは、オブジェクトの動的挙動を追跡し、それらの形状を同時に学習することができる。
本研究では,1つの入力層,2つの隠れ層,および1つの出力層から構成されるナリーディープニューラルネットワークを用いて,それらの形状推定に関する動的オブジェクトを分類する。
論文 参考訳(メタデータ) (2020-02-13T12:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。