論文の概要: Towards Rotation Invariance in Object Detection
- arxiv url: http://arxiv.org/abs/2109.13488v1
- Date: Tue, 28 Sep 2021 04:44:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 00:34:34.935595
- Title: Towards Rotation Invariance in Object Detection
- Title(参考訳): 物体検出における回転不変性に向けて
- Authors: Agastya Kalra, Guy Stoppi, Bradley Brown, Rishav Agarwal and Achuta
Kadambi
- Abstract要約: 本研究では,ボックスラベル回転のデファクト法であるLargest Box Methodが,非常に大きなラベルを生成することを示す。
数行のコードで実装可能な回転増強法を提案する。
- 参考スコア(独自算出の注目度): 6.235602417651423
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Rotation augmentations generally improve a model's invariance/equivariance to
rotation - except in object detection. In object detection the shape is not
known, therefore rotation creates a label ambiguity. We show that the de-facto
method for bounding box label rotation, the Largest Box Method, creates very
large labels, leading to poor performance and in many cases worse performance
than using no rotation at all. We propose a new method of rotation augmentation
that can be implemented in a few lines of code. First, we create a
differentiable approximation of label accuracy and show that axis-aligning the
bounding box around an ellipse is optimal. We then introduce Rotation
Uncertainty (RU) Loss, allowing the model to adapt to the uncertainty of the
labels. On five different datasets (including COCO, PascalVOC, and Transparent
Object Bin Picking), this approach improves the rotational invariance of both
one-stage and two-stage architectures when measured with AP, AP50, and AP75.
The code is available at \url{https://github.com/akasha-imaging/ICCV2021}.
- Abstract(参考訳): 回転増強は一般に、オブジェクト検出を除いて、モデルの回転に対する不変/等価性を改善する。
物体検出では形状が分かっていないため、回転はラベルの曖昧さを生み出す。
ボックスラベルローテーションのデファクト法であるLargest Box Methodは,非常に大きなラベルを生成することで,性能が低下し,ローテーションを全く使わない場合よりも性能が低下することを示す。
本稿では,数行のコードで実装可能な回転拡張法を提案する。
まず,ラベル精度の微分可能近似を作成し,楕円を囲む境界ボックスの軸配向が最適であることを示す。
次に、Rotation Uncertainty (RU) Lossを導入し、モデルがラベルの不確実性に適応できるようにする。
このアプローチは、COCO、PascalVOC、Transparent Object Bin Pickingを含む5つの異なるデータセットにおいて、AP、AP50、AP75で測定された1段アーキテクチャと2段アーキテクチャの回転不変性を改善する。
コードは \url{https://github.com/akasha-imaging/iccv2021} で入手できる。
関連論文リスト
- FRED: Towards a Full Rotation-Equivariance in Aerial Image Object
Detection [28.47314201641291]
FRED(Fully Rotation-Equivariant Oriented Object Detector)を導入する。
提案手法は,DOTA-v1.0では同等の性能を示し,DOTA-v1.5では1.5mAP,モデルパラメータでは16%と大幅に低下する。
論文 参考訳(メタデータ) (2023-12-22T09:31:43Z) - Rotation-Invariant Transformer for Point Cloud Matching [50.365839909264]
我々は,回転不変変換器であるRoITrを導入し,点クラウドマッチングタスクにおけるポーズ変動に対処する。
本稿では,自己認識機構によって学習した,回転不変なクロスフレーム空間認識を備えたグローバルトランスフォーマーを提案する。
RoITrは、Inlier RatioとRegistration Recallの点で、既存のメソッドを少なくとも13と5のパーセンテージで上回っている。
論文 参考訳(メタデータ) (2023-03-14T20:55:27Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - ReDet: A Rotation-equivariant Detector for Aerial Object Detection [27.419045245853706]
これらの問題に対処するために、回転等変性検出器(ReDet)を提案する。
回転同変ネットワークを検出器に組み込んで回転同変特徴を抽出する。
本手法は,空中物体検出作業における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-13T15:37:36Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。