論文の概要: Towards Rotation Invariance in Object Detection
- arxiv url: http://arxiv.org/abs/2109.13488v1
- Date: Tue, 28 Sep 2021 04:44:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 00:34:34.935595
- Title: Towards Rotation Invariance in Object Detection
- Title(参考訳): 物体検出における回転不変性に向けて
- Authors: Agastya Kalra, Guy Stoppi, Bradley Brown, Rishav Agarwal and Achuta
Kadambi
- Abstract要約: 本研究では,ボックスラベル回転のデファクト法であるLargest Box Methodが,非常に大きなラベルを生成することを示す。
数行のコードで実装可能な回転増強法を提案する。
- 参考スコア(独自算出の注目度): 6.235602417651423
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Rotation augmentations generally improve a model's invariance/equivariance to
rotation - except in object detection. In object detection the shape is not
known, therefore rotation creates a label ambiguity. We show that the de-facto
method for bounding box label rotation, the Largest Box Method, creates very
large labels, leading to poor performance and in many cases worse performance
than using no rotation at all. We propose a new method of rotation augmentation
that can be implemented in a few lines of code. First, we create a
differentiable approximation of label accuracy and show that axis-aligning the
bounding box around an ellipse is optimal. We then introduce Rotation
Uncertainty (RU) Loss, allowing the model to adapt to the uncertainty of the
labels. On five different datasets (including COCO, PascalVOC, and Transparent
Object Bin Picking), this approach improves the rotational invariance of both
one-stage and two-stage architectures when measured with AP, AP50, and AP75.
The code is available at \url{https://github.com/akasha-imaging/ICCV2021}.
- Abstract(参考訳): 回転増強は一般に、オブジェクト検出を除いて、モデルの回転に対する不変/等価性を改善する。
物体検出では形状が分かっていないため、回転はラベルの曖昧さを生み出す。
ボックスラベルローテーションのデファクト法であるLargest Box Methodは,非常に大きなラベルを生成することで,性能が低下し,ローテーションを全く使わない場合よりも性能が低下することを示す。
本稿では,数行のコードで実装可能な回転拡張法を提案する。
まず,ラベル精度の微分可能近似を作成し,楕円を囲む境界ボックスの軸配向が最適であることを示す。
次に、Rotation Uncertainty (RU) Lossを導入し、モデルがラベルの不確実性に適応できるようにする。
このアプローチは、COCO、PascalVOC、Transparent Object Bin Pickingを含む5つの異なるデータセットにおいて、AP、AP50、AP75で測定された1段アーキテクチャと2段アーキテクチャの回転不変性を改善する。
コードは \url{https://github.com/akasha-imaging/iccv2021} で入手できる。
関連論文リスト
- FRED: Towards a Full Rotation-Equivariance in Aerial Image Object
Detection [28.47314201641291]
FRED(Fully Rotation-Equivariant Oriented Object Detector)を導入する。
提案手法は,DOTA-v1.0では同等の性能を示し,DOTA-v1.5では1.5mAP,モデルパラメータでは16%と大幅に低下する。
論文 参考訳(メタデータ) (2023-12-22T09:31:43Z) - Rethinking Boundary Discontinuity Problem for Oriented Object Detection [42.136448033031634]
最先端のIoUライクな手法でさえ境界不連続問題を解くことができないことを示す。
既存のIoUライクな手法では、このモデルは基本的に箱と物体の間の角関係を適合させようとするが、そこでは角境界のブレークポイントが予測を非常に不安定にする。
そこで我々は, 可逆性と結合最適化を, 単一の平滑化関数から2つの異なるエンティティに分離し, 角境界補正と他のパラメータとのブレンディングの両目的を初めて達成する。
論文 参考訳(メタデータ) (2023-05-17T09:04:22Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - ART-Point: Improving Rotation Robustness of Point Cloud Classifiers via
Adversarial Rotation [89.47574181669903]
本研究では, 点雲分類器の回転ロバスト性も, 対角訓練により得られることを示す。
具体的には、ART-Pointというフレームワークは、ポイントクラウドの回転を攻撃と見なしている。
最終的なロバストモデルに効率よく到達するために,高速なワンステップ最適化を提案する。
論文 参考訳(メタデータ) (2022-03-08T07:20:16Z) - ReDet: A Rotation-equivariant Detector for Aerial Object Detection [27.419045245853706]
これらの問題に対処するために、回転等変性検出器(ReDet)を提案する。
回転同変ネットワークを検出器に組み込んで回転同変特徴を抽出する。
本手法は,空中物体検出作業における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-13T15:37:36Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。