論文の概要: Dense Label Encoding for Boundary Discontinuity Free Rotation Detection
- arxiv url: http://arxiv.org/abs/2011.09670v4
- Date: Tue, 25 May 2021 08:54:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 20:24:18.893475
- Title: Dense Label Encoding for Boundary Discontinuity Free Rotation Detection
- Title(参考訳): 境界不連続な自由回転検出のためのデンスラベル符号化
- Authors: Xue Yang, Liping Hou, Yue Zhou, Wentao Wang, Junchi Yan
- Abstract要約: 本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
- 参考スコア(独自算出の注目度): 69.75559390700887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rotation detection serves as a fundamental building block in many visual
applications involving aerial image, scene text, and face etc. Differing from
the dominant regression-based approaches for orientation estimation, this paper
explores a relatively less-studied methodology based on classification. The
hope is to inherently dismiss the boundary discontinuity issue as encountered
by the regression-based detectors. We propose new techniques to push its
frontier in two aspects: i) new encoding mechanism: the design of two Densely
Coded Labels (DCL) for angle classification, to replace the Sparsely Coded
Label (SCL) in existing classification-based detectors, leading to three times
training speed increase as empirically observed across benchmarks, further with
notable improvement in detection accuracy; ii) loss re-weighting: we propose
Angle Distance and Aspect Ratio Sensitive Weighting (ADARSW), which improves
the detection accuracy especially for square-like objects, by making DCL-based
detectors sensitive to angular distance and object's aspect ratio. Extensive
experiments and visual analysis on large-scale public datasets for aerial
images i.e. DOTA, UCAS-AOD, HRSC2016, as well as scene text dataset ICDAR2015
and MLT, show the effectiveness of our approach. The source code is available
at https://github.com/Thinklab-SJTU/DCL_RetinaNet_Tensorflow and is also
integrated in our open source rotation detection benchmark:
https://github.com/yangxue0827/RotationDetection.
- Abstract(参考訳): 回転検出は、空中画像、シーンテキスト、顔などを含む多くの視覚アプリケーションにおいて基本的な構成要素として機能する。
配向推定における支配的回帰に基づくアプローチから逸脱し、分類に基づく比較的研究の少ない方法論を探索する。
その目標は、回帰ベースの検出器が直面する境界の不連続性問題を本質的に排除することにある。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
i) 新たな符号化機構: 既存の分類に基づく検出器においてスパース符号化ラベル(scl)を置き換えるために、角度分類のための2つの高密度符号化ラベル(dcl)を設計し、ベンチマークで経験的に観測されるように3倍のトレーニング速度を増加させ、さらに検出精度を著しく向上させる。
二 損失再重み付け: 角距離と物体のアスペクト比に敏感なDCLベースの検出器を作ることにより、特に正方形物体に対する検出精度を向上させるアングル距離とアスペクト比感度重み付け(ADARSW)を提案する。
航空画像の大規模公開データセット(DOTA, UCAS-AOD, HRSC2016, シーンテキストデータセット ICDAR2015 と MLT)に対する大規模な実験と視覚分析により, 本手法の有効性が示された。
ソースコードはhttps://github.com/thinklab-sjtu/dcl_retinanet_tensorflowで公開されています。
関連論文リスト
- Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and
Localization [30.317619885984005]
本稿では,視覚的セグメンテーション基盤モデル,すなわちセグメンテーションモデル(SAM)をフォージェリ検出とローカライゼーションの対面に導入する。
SAMに基づいて,Multiscale Adapterを用いたDADFフレームワークを提案する。
提案するフレームワークは、エンドツーエンドのフォージェリーローカライゼーションと検出最適化をシームレスに統合する。
論文 参考訳(メタデータ) (2023-06-29T16:25:04Z) - ARS-DETR: Aspect Ratio-Sensitive Detection Transformer for Aerial Oriented Object Detection [55.291579862817656]
既存のオブジェクト指向オブジェクト検出手法では、モデルの性能を測定するために計量AP$_50$が一般的である。
我々は、AP$_50$は本来、角度偏差に大きな耐性があるため、オブジェクト指向物体検出には適さないと主張している。
本稿では,ARS-DETR(Aspect Ratio Sensitive Oriented Object Detector with Transformer)を提案する。
論文 参考訳(メタデータ) (2023-03-09T02:20:56Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Dynamic Anchor Learning for Arbitrary-Oriented Object Detection [4.247967690041766]
任意指向オブジェクトは、自然のシーン、空中写真、リモートセンシング画像などに広く現れる。
現在の回転検出器は、異なる向きのアンカーをたくさん使用して、地上の真実ボックスとの空間アライメントを実現します。
新たに定義されたマッチング度を利用した動的アンカー学習(DAL)法を提案する。
論文 参考訳(メタデータ) (2020-12-08T01:30:06Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - Solving Missing-Annotation Object Detection with Background
Recalibration Loss [49.42997894751021]
本稿では,新しい,かつ困難な検出シナリオに焦点を当てる。 真のオブジェクト/インスタンスの大部分は,データセットにラベル付けされていない。
従来, ソフトサンプリングを用いて, 正の例と重なり合うRoIsの勾配を再重み付けする手法が提案されてきた。
本稿では、予め定義されたIoU閾値と入力画像に基づいて損失信号を自動的に校正できる、バックグラウンド校正損失(BRL)と呼ばれる優れた解を提案する。
論文 参考訳(メタデータ) (2020-02-12T23:11:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。