論文の概要: Rethinking Boundary Discontinuity Problem for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2305.10061v2
- Date: Fri, 22 Mar 2024 03:07:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 23:48:38.598287
- Title: Rethinking Boundary Discontinuity Problem for Oriented Object Detection
- Title(参考訳): オブジェクト指向物体検出における境界不連続問題の再考
- Authors: Hang Xu, Xinyuan Liu, Haonan Xu, Yike Ma, Zunjie Zhu, Chenggang Yan, Feng Dai,
- Abstract要約: 最先端のIoUライクな手法でさえ境界不連続問題を解くことができないことを示す。
既存のIoUライクな手法では、このモデルは基本的に箱と物体の間の角関係を適合させようとするが、そこでは角境界のブレークポイントが予測を非常に不安定にする。
そこで我々は, 可逆性と結合最適化を, 単一の平滑化関数から2つの異なるエンティティに分離し, 角境界補正と他のパラメータとのブレンディングの両目的を初めて達成する。
- 参考スコア(独自算出の注目度): 42.136448033031634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oriented object detection has been developed rapidly in the past few years, where rotation equivariance is crucial for detectors to predict rotated boxes. It is expected that the prediction can maintain the corresponding rotation when objects rotate, but severe mutation in angular prediction is sometimes observed when objects rotate near the boundary angle, which is well-known boundary discontinuity problem. The problem has been long believed to be caused by the sharp loss increase at the angular boundary, and widely used joint-optim IoU-like methods deal with this problem by loss-smoothing. However, we experimentally find that even state-of-the-art IoU-like methods actually fail to solve the problem. On further analysis, we find that the key to solution lies in encoding mode of the smoothing function rather than in joint or independent optimization. In existing IoU-like methods, the model essentially attempts to fit the angular relationship between box and object, where the break point at angular boundary makes the predictions highly unstable.To deal with this issue, we propose a dual-optimization paradigm for angles. We decouple reversibility and joint-optim from single smoothing function into two distinct entities, which for the first time achieves the objectives of both correcting angular boundary and blending angle with other parameters.Extensive experiments on multiple datasets show that boundary discontinuity problem is well-addressed. Moreover, typical IoU-like methods are improved to the same level without obvious performance gap. The code is available at https://github.com/hangxu-cv/cvpr24acm.
- Abstract(参考訳): 過去数年間でオブジェクト指向物体検出が急速に発展し、回転するボックスを予測するためには回転同値が不可欠である。
この予測は, 物体が回転するときに対応する回転を維持することができるが, 物体が境界角付近で回転する際には, 角度予測における重度の変異が観察されることがある。
この問題は、長い間、角境界における急激な損失増加に起因すると考えられており、広く使われている共同最適化IoUのような手法は、損失平滑化によってこの問題に対処している。
しかし、現在最先端のIoUライクな手法でさえ、実際にその問題を解決できないことが実験的に判明した。
さらなる解析では、解の鍵は、共同最適化や独立最適化ではなく、平滑化関数の符号化モードにあることが分かる。
既存のIoUライクな手法では, 箱と物体の角関係に適合し, 角境界のブレークポイントが予測を極めて不安定にし, この問題に対処するために, アングルの双対最適化パラダイムを提案する。
我々は、可逆性と結合最適化を単一の滑らか化関数から2つの異なるエンティティに分離し、角境界の補正と他のパラメータとのブレンディング角度の両方の目的を初めて達成する。
さらに、典型的なIoUライクなメソッドは、明らかなパフォーマンスギャップを伴わずに、同じレベルに改善される。
コードはhttps://github.com/hangxu-cv/cvpr24acm.comで公開されている。
関連論文リスト
- ABFL: Angular Boundary Discontinuity Free Loss for Arbitrary Oriented
Object Detection in Aerial Images [0.14504054468850663]
斜め境界自由損失(ABFL)は、向きのある物体を検出する際に、角度境界の不連続性問題を解決することを目的としている。
ABFLは、AOODタスクの回転対称性によって引き起こされる様々な周期的境界不連続性に対する単純かつ効果的な解を提供する。
論文 参考訳(メタデータ) (2023-11-21T03:03:22Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Phase-Shifting Coder: Predicting Accurate Orientation in Oriented Object
Detection [10.99534239215483]
物体の向きを正確に予測するために、位相シフトコーダ(PSC)と呼ばれる新しい微分可能な角度コーダを提案する。
オブジェクト指向物体検出における様々な周期的ファジィ問題に対する統一的なフレームワークを提供する。
3つのデータセットの視覚的分析と実験は、我々のアプローチの有効性と可能性を証明する。
論文 参考訳(メタデータ) (2022-11-11T17:31:25Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。