論文の概要: Linear Gaussian Bounding Box Representation and Ring-Shaped Rotated
Convolution for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2311.05410v2
- Date: Tue, 14 Nov 2023 02:26:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-15 17:36:24.128865
- Title: Linear Gaussian Bounding Box Representation and Ring-Shaped Rotated
Convolution for Oriented Object Detection
- Title(参考訳): 指向性物体検出のための線形ガウス境界ボックス表現とリング型回転畳み込み
- Authors: Zhen Zhou, Yunkai Ma, Junfeng Fan, Zhaoyang Liu, Fengshui Jing and Min
Tan
- Abstract要約: オブジェクト指向物体検出では、オブジェクト指向境界ボックス(OBB)の現在の表現は境界不連続問題にしばしば悩まされる。
GBBの要素を線形変換することで、LGBBは境界不連続問題を避け、高い数値安定性を有する。
また、リング形状の受容場下での回転感受性特徴を抽出するために、任意の向きに特徴写像を適応的に回転させるリング形状の回転畳み込み(RRC)を提案する。
- 参考スコア(独自算出の注目度): 13.946780253720616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In oriented object detection, current representations of oriented bounding
boxes (OBBs) often suffer from boundary discontinuity problem. Methods of
designing continuous regression losses do not essentially solve this problem.
Although Gaussian bounding box (GBB) representation avoids this problem,
directly regressing GBB is susceptible to numerical instability. We propose
linear GBB (LGBB), a novel OBB representation. By linearly transforming the
elements of GBB, LGBB avoids the boundary discontinuity problem and has high
numerical stability. In addition, existing convolution-based rotation-sensitive
feature extraction methods only have local receptive fields, resulting in slow
feature aggregation. We propose ring-shaped rotated convolution (RRC), which
adaptively rotates feature maps to arbitrary orientations to extract
rotation-sensitive features under a ring-shaped receptive field, rapidly
aggregating features and contextual information. Experimental results
demonstrate that LGBB and RRC achieve state-of-the-art performance.
Furthermore, integrating LGBB and RRC into various models effectively improves
detection accuracy.
- Abstract(参考訳): オブジェクト指向物体検出では、オブジェクト指向境界ボックス(OBB)の現在の表現は境界不連続問題にしばしば悩まされる。
連続回帰損失を設計する方法は、この問題を本質的に解決するものではない。
ガウス境界ボックス(gbb)の表現はこの問題を回避するが、直接回帰gbbは数値不安定化の影響を受けやすい。
我々は,新しいOBB表現である線形GBB(LGBB)を提案する。
GBBの要素を線形変換することにより、LGBBは境界不連続問題を避け、高い数値安定性を有する。
加えて、既存の畳み込みに基づく回転感応特徴抽出法は局所受容場しか持たず、特徴集約が遅くなる。
本稿では,輪状受容場下での回転感性特徴を抽出するために,特徴写像を任意の向きに適応的に回転させるリング型回転畳み込み(RRC)を提案する。
実験の結果,LGBBとRCは最先端の性能を達成できた。
さらに,LGBBとRCを様々なモデルに統合することで,検出精度が向上する。
関連論文リスト
- Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Implicit Neural Representation for Mesh-Free Inverse Obstacle Scattering [21.459567997723376]
多層パーセプトロンのレベルセットとしての形状のインプシット表現は、最近、形状解析、圧縮、再構成タスクで栄えている。
メッシュフリーで逆障害物散乱問題を解決するための暗黙的ニューラルネットワーク表現に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-04T17:16:09Z) - G-Rep: Gaussian Representation for Arbitrary-Oriented Object Detection [13.112764410519981]
我々は,OBB,QBB,PointSetのガウス分布を構成するために,G-Repと呼ばれる統一ガウス表現を提案する。
G-Repは、様々な表現や問題に対する統一的な解を達成する。
論文 参考訳(メタデータ) (2022-05-24T05:28:08Z) - Learning Polar Encodings for Arbitrary-Oriented Ship Detection in SAR
Images [22.93997487064683]
oriented bounding box (obb) に基づく手法は研究者から徐々に注目を集めている。
最近提案された深層学習に基づくOBB検出手法のほとんどは、角度やキーポイント回帰における境界不連続問題に遭遇する。
本稿では,極性符号化を学習し,SAR船の検出を提案する。
論文 参考訳(メタデータ) (2021-03-24T12:52:54Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Hybrid Trilinear and Bilinear Programming for Aligning Partially
Overlapping Point Sets [85.71360365315128]
多くの応用において、部分重なり合う点集合が対応するRPMアルゴリズムに不変であるようなアルゴリズムが必要である。
まず、目的が立方体有界関数であることを示し、次に、三線型および双線型単相変換の凸エンベロープを用いて、その下界を導出する。
次に、変換変数上の分岐のみを効率よく実行するブランチ・アンド・バウンド(BnB)アルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-01-19T04:24:23Z) - Canny-VO: Visual Odometry with RGB-D Cameras based on Geometric 3D-2D
Edge Alignment [85.32080531133799]
本稿では,自由形式の曲線登録に関する古典的な問題をレビューし,効率的なrgbdビジュアルオドメトリシステムcanny-voに適用する。
エッジ登録でよく用いられる距離変換の代替として、近似近接近傍場と配向近接近傍場という2つの方法が提案されている。
3D2Dエッジアライメントは、効率性と精度の両方の観点から、これらの代替製剤の恩恵を受けます。
論文 参考訳(メタデータ) (2020-12-15T11:42:17Z) - Fast Gravitational Approach for Rigid Point Set Registration with
Ordinary Differential Equations [79.71184760864507]
本稿では,FGA(Fast Gravitational Approach)と呼ばれる厳密な点集合アライメントのための物理に基づく新しい手法を紹介する。
FGAでは、ソースとターゲットの点集合は、シミュレーションされた重力場内を移動しながら、世界規模で多重リンクされた方法で相互作用する質量を持つ剛体粒子群として解釈される。
従来のアライメント手法では,新しいメソッドクラスには特徴がないことを示す。
論文 参考訳(メタデータ) (2020-09-28T15:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。