論文の概要: Optimization for Oriented Object Detection via Representation Invariance
Loss
- arxiv url: http://arxiv.org/abs/2103.11636v1
- Date: Mon, 22 Mar 2021 07:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:30:00.081434
- Title: Optimization for Oriented Object Detection via Representation Invariance
Loss
- Title(参考訳): 表現不変損失による指向性物体検出の最適化
- Authors: Qi Ming, Zhiqiang Zhou, Lingjuan Miao, Xue Yang, Yunpeng Dong
- Abstract要約: 主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
- 参考スコア(独自算出の注目度): 2.501282372971187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arbitrary-oriented objects exist widely in natural scenes, and thus the
oriented object detection has received extensive attention in recent years. The
mainstream rotation detectors use oriented bounding boxes (OBB) or
quadrilateral bounding boxes (QBB) to represent the rotating objects. However,
these methods suffer from the representation ambiguity for oriented object
definition, which leads to suboptimal regression optimization and the
inconsistency between the loss metric and the localization accuracy of the
predictions. In this paper, we propose a Representation Invariance Loss (RIL)
to optimize the bounding box regression for the rotating objects. Specifically,
RIL treats multiple representations of an oriented object as multiple
equivalent local minima, and hence transforms bounding box regression into an
adaptive matching process with these local minima. Then, the Hungarian matching
algorithm is adopted to obtain the optimal regression strategy. We also propose
a normalized rotation loss to alleviate the weak correlation between different
variables and their unbalanced loss contribution in OBB representation.
Extensive experiments on remote sensing datasets and scene text datasets show
that our method achieves consistent and substantial improvement. The source
code and trained models are available at https://github.com/ming71/RIDet.
- Abstract(参考訳): 任意の向きのオブジェクトは自然のシーンに広く存在し、指向のオブジェクト検出は近年広く注目を集めている。
主回転検出器は、回転物体を表すために、向き付けられた有界箱(OBB)または四角形の有界箱(QBB)を使用する。
しかし、これらの手法はオブジェクト指向オブジェクト定義の表現の曖昧さに悩まされ、最適下回帰最適化と損失計量と予測の局所化精度の不整合をもたらす。
本稿では,回転物体のバウンディングボックス回帰を最適化するRepresentation Invariance Loss (RIL)を提案する。
具体的には、RILはオブジェクト指向対象の複数の表現を多重同値な局所ミニマとして扱い、従って境界ボックス回帰をこれらの局所ミニマとの適応マッチングプロセスに変換する。
そして、最適な回帰戦略を得るためにハンガリーマッチングアルゴリズムを採用する。
また,OBB表現における変数間の弱相関と不均衡損失寄与を軽減するために,正規化回転損失を提案する。
リモートセンシングデータセットとシーンテキストデータセットの大規模な実験により,本手法が一貫した,実質的な改善を実現することが示された。
ソースコードとトレーニングされたモデルはhttps://github.com/ming71/RIDet.comで入手できる。
関連論文リスト
- FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection [10.655167287088368]
最小点距離に基づく任意の形状比較のための新しい計量法を提案する。
FPDIoU$損失は、最先端の回転オブジェクト検出に適用される。
論文 参考訳(メタデータ) (2024-05-16T09:44:00Z) - FRED: Towards a Full Rotation-Equivariance in Aerial Image Object
Detection [28.47314201641291]
FRED(Fully Rotation-Equivariant Oriented Object Detector)を導入する。
提案手法は,DOTA-v1.0では同等の性能を示し,DOTA-v1.5では1.5mAP,モデルパラメータでは16%と大幅に低下する。
論文 参考訳(メタデータ) (2023-12-22T09:31:43Z) - Revisiting Proposal-based Object Detection [59.97295544455179]
提案手法により画像中の物体を検出するパイプラインを再検討する。
我々は提案と根拠的真理の交わりの領域に回帰する単純な問題を解決する。
私たちの再検討されたアプローチは、検出パイプラインの変更を最小限にして、既存のメソッドにプラグインすることができます。
論文 参考訳(メタデータ) (2023-11-30T12:40:23Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - DARE-GRAM : Unsupervised Domain Adaptation Regression by Aligning
Inverse Gram Matrices [3.5933327773749513]
Unlabelled Domain Adaptation Regression (DAR)は、ラベル付きソースデータセットと、レグレッション問題のための教師なしターゲットデータセットの間のドメインギャップを埋めることを目的としている。
本稿では, 線形回帰器に対する閉形式正規最小二乗(OLS)解を深い領域適応文脈で解析することにより, DAR問題に対する異なる視点を示す。
擬似逆低ランク特性を利用して選択した部分空間のスケールと角度を整列する簡易かつ効果的なDAR法を提案する。
論文 参考訳(メタデータ) (2023-03-23T15:04:23Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Rethinking Spatial Invariance of Convolutional Networks for Object
Counting [119.83017534355842]
局所連結ガウス核を用いて元の畳み込みフィルタを置き換え、密度写像の空間位置を推定する。
従来の研究から着想を得て,大規模なガウス畳み込みの近似を好意的に実装するために,翻訳不変性を伴う低ランク近似を提案する。
提案手法は,他の最先端手法を著しく上回り,物体の空間的位置の有望な学習を実現する。
論文 参考訳(メタデータ) (2022-06-10T17:51:25Z) - A Systematic Evaluation of Object Detection Networks for Scientific
Plots [17.882932963813985]
PlotQAデータセット上で、様々なSOTAオブジェクト検出ネットワークの精度をトレーニングし比較する。
0.5の標準IOU設定では、ほとんどのネットワークはプロット内の比較的単純な物体を検出する場合、mAPスコアが80%以上である。
しかし、パフォーマンスは0.9のより厳格なIOUで評価されると大幅に低下し、最高のモデルでmAPは35.70%となった。
論文 参考訳(メタデータ) (2020-07-05T05:30:53Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。