論文の概要: An Analysis of SVD for Deep Rotation Estimation
- arxiv url: http://arxiv.org/abs/2006.14616v1
- Date: Thu, 25 Jun 2020 17:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 04:15:41.206084
- Title: An Analysis of SVD for Deep Rotation Estimation
- Title(参考訳): 深部回転推定のためのSVDの解析
- Authors: Jake Levinson, Carlos Esteves, Kefan Chen, Noah Snavely, Angjoo
Kanazawa, Afshin Rostamizadeh, Ameesh Makadia
- Abstract要約: SVDが回転群に射影する自然な選択であることを示す理論的解析を提案する。
解析の結果,既存の表現をSVDの直交化手順に置き換えれば,多くのディープラーニングアプリケーションにおいて,技術性能の状態を得られることがわかった。
- 参考スコア(独自算出の注目度): 63.97835949897361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symmetric orthogonalization via SVD, and closely related procedures, are
well-known techniques for projecting matrices onto $O(n)$ or $SO(n)$. These
tools have long been used for applications in computer vision, for example
optimal 3D alignment problems solved by orthogonal Procrustes, rotation
averaging, or Essential matrix decomposition. Despite its utility in different
settings, SVD orthogonalization as a procedure for producing rotation matrices
is typically overlooked in deep learning models, where the preferences tend
toward classic representations like unit quaternions, Euler angles, and
axis-angle, or more recently-introduced methods. Despite the importance of 3D
rotations in computer vision and robotics, a single universally effective
representation is still missing. Here, we explore the viability of SVD
orthogonalization for 3D rotations in neural networks. We present a theoretical
analysis that shows SVD is the natural choice for projecting onto the rotation
group. Our extensive quantitative analysis shows simply replacing existing
representations with the SVD orthogonalization procedure obtains state of the
art performance in many deep learning applications covering both supervised and
unsupervised training.
- Abstract(参考訳): SVD による対称直交化と密接に関連する手順は、行列を $O(n)$ あるいは $SO(n)$ に射影するためのよく知られた技法である。
これらのツールは長い間コンピュータビジョンの応用に使われており、例えば直交プロクサート、回転平均化、本質行列分解によって解かれる最適な3次元アライメント問題などである。
異なる設定で有用であるにもかかわらず、回転行列を生成する手順としてのsvd直交化は、通常、深層学習モデルでは見過ごされ、単位四元数、オイラー角、軸角、あるいはより最近導入された方法のような古典的な表現を好む。
コンピュータビジョンとロボット工学における3次元回転の重要性にもかかわらず、単一の普遍的に有効な表現はいまだに欠けている。
本稿では,ニューラルネットワークにおける3次元回転のSVD直交化の実現可能性について検討する。
SVDが回転群に射影する自然な選択であることを示す理論的解析を提案する。
我々は,既存の表現をSVDの直交化手順に置き換えることで,教師なし学習と教師なし学習の両方をカバーする多くの深層学習アプリケーションにおいて,技術性能の状態を得られることを示す。
関連論文リスト
- Object Gaussian for Monocular 6D Pose Estimation from Sparse Views [4.290993205307184]
ガウス的手法を用いたスパースビューオブジェクトポーズ推定のための新しいフレームワークであるSGPoseを紹介する。
最大10ビューを与えられたSGPoseは、ランダムな立方体から始めることで幾何学的認識表現を生成する。
典型的なベンチマーク、特にOcclusion LM-Oデータセットの実験では、SGPoseはスパースビューの制約下であっても既存のメソッドよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-09-04T10:03:11Z) - Learning Unorthogonalized Matrices for Rotation Estimation [83.94986875750455]
3次元の回転を推定することは、3次元コンピュータビジョンの一般的な手順である。
回転行列という表現の1つの形式は、その連続性のために人気がある。
非直交擬似擬似回転行列(PRoM)を提案する。
論文 参考訳(メタデータ) (2023-12-01T09:56:29Z) - Evaluating 3D Shape Analysis Methods for Robustness to Rotation
Invariance [22.306775502181818]
本稿では,最近の3次元形状記述子のSO(3)回転に対する堅牢性について解析する。
物体が異なる方向で行われる3次元屋内シーンのデータベースを考察する。
論文 参考訳(メタデータ) (2023-05-29T18:39:31Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z) - Why Approximate Matrix Square Root Outperforms Accurate SVD in Global
Covariance Pooling? [59.820507600960745]
本稿では,前方通過のSVDと後方伝播のPad'e近似を用いて勾配を計算する新しいGCPメタ層を提案する。
提案するメタレイヤは,さまざまなCNNモデルに統合され,大規模および微細なデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-06T08:03:45Z) - Deep regression on manifolds: a 3D rotation case study [0.0]
ユークリッド空間の任意の入力をこの多様体に写す微分可能函数は、適切な訓練を可能にするために満足すべきであることを示す。
3次元回転空間上の様々な微分可能写像と、写像の局所線型性の重要性に関する予想を比較する。
3x3行列のプロクルストーソノーマリゼーションに基づく写像は、一般的に考慮されたものの中で最良であることを示す。
論文 参考訳(メタデータ) (2021-03-30T13:07:36Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。