論文の概要: Rethinking Boundary Discontinuity Problem for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2305.10061v1
- Date: Wed, 17 May 2023 09:04:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 16:46:36.667506
- Title: Rethinking Boundary Discontinuity Problem for Oriented Object Detection
- Title(参考訳): オブジェクト指向物体検出における境界不連続問題の再考
- Authors: Hang Xu, Xinyuan Liu, Haonan Xu, Yike Ma, Zunjie Zhu, Chenggang Yan,
Feng Dai
- Abstract要約: 極座標分解に基づく簡易かつ効果的な角度補正モジュール(ACM)を提案する。
ACMは、角度予測を修復するために、オブジェクト指向物体検出器のワークフローに簡単に接続できる。
モデル出力の滑らかな値をソートゥースの角値に変換し、IoUライクな損失はそのポテンシャルを完全に解放することができる。
- 参考スコア(独自算出の注目度): 37.41960822673335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oriented object detection has been developed rapidly in the past few years,
where rotation equivariant is crucial for detectors to predict rotated bounding
boxes. It is expected that the prediction can maintain the corresponding
rotation when objects rotate, but severe mutational in angular prediction is
sometimes observed when objects rotate near the boundary angle, which is
well-known boundary discontinuity problem. The problem has been long believed
to be caused by the sharp loss increase at the angular boundary during
training, and widely used IoU-like loss generally deal with this problem by
loss-smoothing. However, we experimentally find that even state-of-the-art
IoU-like methods do not actually solve the problem. On further analysis, we
find the essential cause of the problem lies at discontinuous angular
ground-truth(box), not just discontinuous loss. There always exists an
irreparable gap between continuous model ouput and discontinuous angular
ground-truth, so angular prediction near the breakpoints becomes highly
unstable, which cannot be eliminated just by loss-smoothing in IoU-like
methods. To thoroughly solve this problem, we propose a simple and effective
Angle Correct Module (ACM) based on polar coordinate decomposition. ACM can be
easily plugged into the workflow of oriented object detectors to repair angular
prediction. It converts the smooth value of the model output into sawtooth
angular value, and then IoU-like loss can fully release their potential.
Extensive experiments on multiple datasets show that whether Gaussian-based or
SkewIoU methods are improved to the same performance of AP50 and AP75 with the
enhancement of ACM.
- Abstract(参考訳): オブジェクト指向物体検出はここ数年で急速に発展し、回転同変は検出器が回転する境界ボックスを予測するために不可欠である。
この予測は, 物体が回転するときに対応する回転を維持することができるが, 物体が境界角付近で回転する際には, 厳密な変異が観察されることがある。
この問題は、訓練中の角界の急激な損失増加に起因すると考えられており、広く使用されているIoU様の損失は、一般的に損失平滑化によってこの問題に対処する。
しかし、現在最先端のIoUライクな手法でさえ、実際にこの問題を解くことはできない。
さらなる分析では、問題の本質的な原因は、不連続な損失だけでなく、不連続な角の真実(ボックス)にある。
連続モデルと不連続な角の接地構造の間には常に不可分なギャップが存在するため、ブレークポイント付近の角の予測は非常に不安定になり、IoUのような方法での損失平滑化だけでは除去できない。
そこで本研究では,極座標分解に基づく簡易かつ効果的な角度補正モジュール(ACM)を提案する。
ACMは、角度予測を修復するために、オブジェクト指向物体検出器のワークフローに簡単に接続できる。
モデル出力の滑らかな値をソートゥースの角値に変換し、IoUライクな損失はそのポテンシャルを完全に解放することができる。
複数のデータセットに対する大規模な実験により、ガウス法とSkewIoU法がAP50とAP75と同じ性能に改善され、ACMが強化された。
関連論文リスト
- ABFL: Angular Boundary Discontinuity Free Loss for Arbitrary Oriented
Object Detection in Aerial Images [0.14504054468850663]
斜め境界自由損失(ABFL)は、向きのある物体を検出する際に、角度境界の不連続性問題を解決することを目的としている。
ABFLは、AOODタスクの回転対称性によって引き起こされる様々な周期的境界不連続性に対する単純かつ効果的な解を提供する。
論文 参考訳(メタデータ) (2023-11-21T03:03:22Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Phase-Shifting Coder: Predicting Accurate Orientation in Oriented Object
Detection [10.99534239215483]
物体の向きを正確に予測するために、位相シフトコーダ(PSC)と呼ばれる新しい微分可能な角度コーダを提案する。
オブジェクト指向物体検出における様々な周期的ファジィ問題に対する統一的なフレームワークを提供する。
3つのデータセットの視覚的分析と実験は、我々のアプローチの有効性と可能性を証明する。
論文 参考訳(メタデータ) (2022-11-11T17:31:25Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。