論文の概要: G-Rep: Gaussian Representation for Arbitrary-Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2205.11796v1
- Date: Tue, 24 May 2022 05:28:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 12:36:00.136623
- Title: G-Rep: Gaussian Representation for Arbitrary-Oriented Object Detection
- Title(参考訳): G-Rep:任意オブジェクト指向物体検出のためのガウス表現
- Authors: Liping Hou, Ke Lu, Xue Yang, Yuqiu Li, Jian Xue
- Abstract要約: 我々は,OBB,QBB,PointSetのガウス分布を構成するために,G-Repと呼ばれる統一ガウス表現を提案する。
G-Repは、様々な表現や問題に対する統一的な解を達成する。
- 参考スコア(独自算出の注目度): 13.112764410519981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arbitrary-oriented object representations contain the oriented bounding box
(OBB), quadrilateral bounding box (QBB), and point set (PointSet). Each
representation encounters problems that correspond to its characteristics, such
as the boundary discontinuity, square-like problem, representation ambiguity,
and isolated points, which lead to inaccurate detection. Although many
effective strategies have been proposed for various representations, there is
still no unified solution. Current detection methods based on Gaussian modeling
have demonstrated the possibility of breaking this dilemma; however, they
remain limited to OBB. To go further, in this paper, we propose a unified
Gaussian representation called G-Rep to construct Gaussian distributions for
OBB, QBB, and PointSet, which achieves a unified solution to various
representations and problems. Specifically, PointSet or QBB-based objects are
converted into Gaussian distributions, and their parameters are optimized using
the maximum likelihood estimation algorithm. Then, three optional Gaussian
metrics are explored to optimize the regression loss of the detector because of
their excellent parameter optimization mechanisms. Furthermore, we also use
Gaussian metrics for sampling to align label assignment and regression loss.
Experimental results on several public available datasets, DOTA, HRSC2016,
UCAS-AOD, and ICDAR2015 show the excellent performance of the proposed method
for arbitrary-oriented object detection. The code has been open sourced at
https://github.com/open-mmlab/mmrotate.
- Abstract(参考訳): 任意指向オブジェクト表現は、向き付きバウンディングボックス(OBB)、四角形バウンディングボックス(QBB)、ポイントセット(PointSet)を含む。
それぞれの表現は、境界の不連続性、正方形問題、表現曖昧性、孤立点など、その特性に対応する問題に遭遇し、不正確な検出につながる。
様々な表現に対して多くの効果的な戦略が提案されているが、まだ統一された解はない。
ガウスモデルに基づく現在の検出法は、このジレンマを破る可能性を証明しているが、それらはobbに限定されている。
さらに,本論文では,様々な表現や問題に対する統一解を実現するために,obb,qbb,pointset のガウス分布を構成するために,g-rep と呼ばれる統一ガウス表現を提案する。
具体的には、PointSetまたはQBBベースのオブジェクトをガウス分布に変換し、そのパラメータを最大推定アルゴリズムを用いて最適化する。
次に、3つの任意ガウス計量を探索し、そのパラメータ最適化機構により検出器の回帰損失を最適化する。
さらに,ラベル割当と回帰損失の調整にはガウスメトリクスを用いたサンプリングも用いる。
いくつかの公開データセット、DOTA, HRSC2016, UCAS-AOD, ICDAR2015による実験結果から, 任意の対象検出のための提案手法の優れた性能を示した。
コードはhttps://github.com/open-mmlab/mmrotateで公開されている。
関連論文リスト
- Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Linear Gaussian Bounding Box Representation and Ring-Shaped Rotated
Convolution for Oriented Object Detection [13.946780253720616]
オブジェクト指向物体検出では、オブジェクト指向境界ボックス(OBB)の現在の表現は境界不連続問題にしばしば悩まされる。
GBBの要素を線形変換することで、LGBBは境界不連続問題を避け、高い数値安定性を有する。
また、リング形状の受容場下での回転感受性特徴を抽出するために、任意の向きに特徴写像を適応的に回転させるリング形状の回転畳み込み(RRC)を提案する。
論文 参考訳(メタデータ) (2023-11-09T14:45:22Z) - Graph Signal Sampling for Inductive One-Bit Matrix Completion: a
Closed-form Solution [112.3443939502313]
グラフ信号解析と処理の利点を享受する統合グラフ信号サンプリングフレームワークを提案する。
キーとなる考え方は、各ユーザのアイテムのレーティングをアイテムイットグラフの頂点上の関数(信号)に変換することである。
オンライン設定では、グラフフーリエ領域における連続ランダムガウス雑音を考慮したベイズ拡張(BGS-IMC)を開発する。
論文 参考訳(メタデータ) (2023-02-08T08:17:43Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - MKIoU Loss: Towards Accurate Oriented Object Detection in Aerial Images [0.0]
修正されたカルマンIoUのSkewIoUの損失は、MkioUと呼ばれる。
提案手法は他のガウス法にも容易に拡張できる。
論文 参考訳(メタデータ) (2022-06-30T08:17:01Z) - Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for
Object Detection [0.0]
本稿では,ガウス分布を用いた対象領域のファジィ表現について述べる。
また,Helinger Distance に基づくガウス分布の類似度尺度も提示し,確率的交叉対ユニオン(ProbIoU)とみなすことができる。
論文 参考訳(メタデータ) (2021-06-10T22:24:31Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Hybrid Trilinear and Bilinear Programming for Aligning Partially
Overlapping Point Sets [85.71360365315128]
多くの応用において、部分重なり合う点集合が対応するRPMアルゴリズムに不変であるようなアルゴリズムが必要である。
まず、目的が立方体有界関数であることを示し、次に、三線型および双線型単相変換の凸エンベロープを用いて、その下界を導出する。
次に、変換変数上の分岐のみを効率よく実行するブランチ・アンド・バウンド(BnB)アルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-01-19T04:24:23Z) - Canny-VO: Visual Odometry with RGB-D Cameras based on Geometric 3D-2D
Edge Alignment [85.32080531133799]
本稿では,自由形式の曲線登録に関する古典的な問題をレビューし,効率的なrgbdビジュアルオドメトリシステムcanny-voに適用する。
エッジ登録でよく用いられる距離変換の代替として、近似近接近傍場と配向近接近傍場という2つの方法が提案されている。
3D2Dエッジアライメントは、効率性と精度の両方の観点から、これらの代替製剤の恩恵を受けます。
論文 参考訳(メタデータ) (2020-12-15T11:42:17Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。