論文の概要: Linear Gaussian Bounding Box Representation and Ring-Shaped Rotated
Convolution for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2311.05410v1
- Date: Thu, 9 Nov 2023 14:45:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 15:05:43.208614
- Title: Linear Gaussian Bounding Box Representation and Ring-Shaped Rotated
Convolution for Oriented Object Detection
- Title(参考訳): 指向性物体検出のための線形ガウス境界ボックス表現とリング型回転畳み込み
- Authors: Zhen Zhou, Yunkai Ma, Junfeng Fan, Zhaoyang Liu, Fengshui Jing and Min
Tan
- Abstract要約: 本稿では,新しい OBB 表現である線形 GBB (LGBB) を提案する。
GBBの要素を線形変換することにより、LGBBは境界不連続性や表現曖昧性の問題を持たず、高い数値安定性を有する。
また,リング型回転畳み込み (RRC) も提案し, 輪状受容場下で回転感性特徴を抽出し, 回転感性特徴と文脈情報を迅速に集約する。
- 参考スコア(独自算出の注目度): 13.946780253720616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the frequent variability of object orientation, accurate prediction of
orientation information remains a challenge in oriented object detection. To
better extract orientation-related information, current methods primarily focus
on the design of reasonable representations of oriented bounding box (OBB) and
rotation-sensitive feature extraction. However, existing OBB representations
often suffer from boundary discontinuity and representation ambiguity problems.
Methods of designing continuous and unambiguous regression losses do not
essentially solve such problems. Gaussian bounding box (GBB) avoids these OBB
representation problems, but directly regressing GBB is susceptible to
numerical instability. In this paper, we propose linear GBB (LGBB), a novel OBB
representation. By linearly transforming the elements of GBB, LGBB does not
have the boundary discontinuity and representation ambiguity problems, and have
high numerical stability. On the other hand, current rotation-sensitive feature
extraction methods based on convolutions can only extract features under a
local receptive field, which is slow in aggregating rotation-sensitive
features. To address this issue, we propose ring-shaped rotated convolution
(RRC). By adaptively rotating feature maps to arbitrary orientations, RRC
extracts rotation-sensitive features under a ring-shaped receptive field,
rapidly aggregating rotation-sensitive features and contextual information. RRC
can be applied to various models in a plug-and-play manner. Experimental
results demonstrate that the proposed LGBB and RRC are effective and achieve
state-of-the-art (SOTA) performance. By integrating LGBB and RRC into various
models, the detection accuracy is effectively improved on DOTA and HRSC2016
datasets.
- Abstract(参考訳): 対象方向の頻繁な変動のため、方向情報の正確な予測はオブジェクト指向対象検出の課題である。
方向関連情報をよりよく抽出するために、現在の手法は主にオブジェクト指向境界ボックス(OBB)の合理的表現と回転感度特徴抽出の設計に焦点を当てている。
しかし、既存のobb表現はしばしば境界の不連続性と表現曖昧性の問題に苦しむ。
連続的かつ曖昧な回帰損失を設計する方法は、そのような問題を本質的には解決しない。
ガウス境界ボックス (GBB) はこれらの OBB 表現問題を回避するが、直接退避する GBB は数値不安定性の影響を受けやすい。
本稿では,新しい OBB 表現である線形 GBB (LGBB) を提案する。
GBBの要素を線形変換することにより、LGBBは境界不連続性や表現曖昧性の問題を持たず、高い数値安定性を有する。
一方、畳み込みに基づく現在の回転感応特徴抽出法は局所受容場下でのみ特徴を抽出することができ、回転感応特徴の集約が遅い。
この問題に対処するため,リング状回転畳み込み(RRC)を提案する。
任意の向きに適応的に回転する特徴写像により、rrcはリング状の受容場の下で回転感応特徴を抽出し、迅速に回転感応特徴と文脈情報を抽出する。
RRCは様々なモデルにプラグアンドプレイで適用することができる。
実験の結果,lgbb と rrc は実効性を示し,最新技術 (sota) 性能を達成した。
LGBBとRCを様々なモデルに統合することにより、DOTAとHRSC2016データセットで検出精度が効果的に向上する。
関連論文リスト
- Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Implicit Neural Representation for Mesh-Free Inverse Obstacle Scattering [21.459567997723376]
多層パーセプトロンのレベルセットとしての形状のインプシット表現は、最近、形状解析、圧縮、再構成タスクで栄えている。
メッシュフリーで逆障害物散乱問題を解決するための暗黙的ニューラルネットワーク表現に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-04T17:16:09Z) - G-Rep: Gaussian Representation for Arbitrary-Oriented Object Detection [13.112764410519981]
我々は,OBB,QBB,PointSetのガウス分布を構成するために,G-Repと呼ばれる統一ガウス表現を提案する。
G-Repは、様々な表現や問題に対する統一的な解を達成する。
論文 参考訳(メタデータ) (2022-05-24T05:28:08Z) - Learning Polar Encodings for Arbitrary-Oriented Ship Detection in SAR
Images [22.93997487064683]
oriented bounding box (obb) に基づく手法は研究者から徐々に注目を集めている。
最近提案された深層学習に基づくOBB検出手法のほとんどは、角度やキーポイント回帰における境界不連続問題に遭遇する。
本稿では,極性符号化を学習し,SAR船の検出を提案する。
論文 参考訳(メタデータ) (2021-03-24T12:52:54Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Hybrid Trilinear and Bilinear Programming for Aligning Partially
Overlapping Point Sets [85.71360365315128]
多くの応用において、部分重なり合う点集合が対応するRPMアルゴリズムに不変であるようなアルゴリズムが必要である。
まず、目的が立方体有界関数であることを示し、次に、三線型および双線型単相変換の凸エンベロープを用いて、その下界を導出する。
次に、変換変数上の分岐のみを効率よく実行するブランチ・アンド・バウンド(BnB)アルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-01-19T04:24:23Z) - Canny-VO: Visual Odometry with RGB-D Cameras based on Geometric 3D-2D
Edge Alignment [85.32080531133799]
本稿では,自由形式の曲線登録に関する古典的な問題をレビューし,効率的なrgbdビジュアルオドメトリシステムcanny-voに適用する。
エッジ登録でよく用いられる距離変換の代替として、近似近接近傍場と配向近接近傍場という2つの方法が提案されている。
3D2Dエッジアライメントは、効率性と精度の両方の観点から、これらの代替製剤の恩恵を受けます。
論文 参考訳(メタデータ) (2020-12-15T11:42:17Z) - Fast Gravitational Approach for Rigid Point Set Registration with
Ordinary Differential Equations [79.71184760864507]
本稿では,FGA(Fast Gravitational Approach)と呼ばれる厳密な点集合アライメントのための物理に基づく新しい手法を紹介する。
FGAでは、ソースとターゲットの点集合は、シミュレーションされた重力場内を移動しながら、世界規模で多重リンクされた方法で相互作用する質量を持つ剛体粒子群として解釈される。
従来のアライメント手法では,新しいメソッドクラスには特徴がないことを示す。
論文 参考訳(メタデータ) (2020-09-28T15:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。