論文の概要: Deep Projective Rotation Estimation through Relative Supervision
- arxiv url: http://arxiv.org/abs/2211.11182v1
- Date: Mon, 21 Nov 2022 04:58:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:40:42.835805
- Title: Deep Projective Rotation Estimation through Relative Supervision
- Title(参考訳): 相対的監督による深部射影回転推定
- Authors: Brian Okorn, Chuer Pan, Martial Hebert, David Held
- Abstract要約: ディープラーニングは、画像ベースの向き推定器を開発する方法を提供する。
これらの推定器は、しばしば大きなラベル付きデータセットのトレーニングを必要とする。
自己教師付き配向推定のための新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 31.05330535795121
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Orientation estimation is the core to a variety of vision and robotics tasks
such as camera and object pose estimation. Deep learning has offered a way to
develop image-based orientation estimators; however, such estimators often
require training on a large labeled dataset, which can be time-intensive to
collect. In this work, we explore whether self-supervised learning from
unlabeled data can be used to alleviate this issue. Specifically, we assume
access to estimates of the relative orientation between neighboring poses, such
that can be obtained via a local alignment method. While self-supervised
learning has been used successfully for translational object keypoints, in this
work, we show that naively applying relative supervision to the rotational
group $SO(3)$ will often fail to converge due to the non-convexity of the
rotational space. To tackle this challenge, we propose a new algorithm for
self-supervised orientation estimation which utilizes Modified Rodrigues
Parameters to stereographically project the closed manifold of $SO(3)$ to the
open manifold of $\mathbb{R}^{3}$, allowing the optimization to be done in an
open Euclidean space. We empirically validate the benefits of the proposed
algorithm for rotational averaging problem in two settings: (1) direct
optimization on rotation parameters, and (2) optimization of parameters of a
convolutional neural network that predicts object orientations from images. In
both settings, we demonstrate that our proposed algorithm is able to converge
to a consistent relative orientation frame much faster than algorithms that
purely operate in the $SO(3)$ space. Additional information can be found at
https://sites.google.com/view/deep-projective-rotation/home .
- Abstract(参考訳): オリエンテーション推定は、カメラやオブジェクトのポーズ推定のような様々なビジョンやロボティクスのタスクの中核である。
ディープラーニングは、画像ベースの向き推定器を開発する方法を提供しているが、そのような推定器は、収集に時間を要する大規模なラベル付きデータセットのトレーニングを必要とすることが多い。
本研究では,ラベルなしデータからの自己教師あり学習がこの問題を緩和できるかどうかを検討する。
具体的には,局所アライメント法によって得られる近傍ポーズ間の相対方向の推定値へのアクセスを想定する。
自己教師付き学習は, 翻訳対象のキーポイントに対して有効であるが, 本研究では, 回転群 $so(3)$ に対して相対的監督を適用する場合, 回転空間の非凸性のため, しばしば収束しないことを示す。
この課題に対処するために、修正ロドリゲスパラメータを用いて、$SO(3)$ の閉多様体を $\mathbb{R}^{3}$ の開多様体にステレオグラフィック的に投影し、その最適化をオープンユークリッド空間で行えるように、自己教師付き配向推定の新しいアルゴリズムを提案する。
本研究では,(1)回転パラメータの直接最適化,(2)画像から物体の向きを予測する畳み込みニューラルネットワークのパラメータの最適化という2つの設定において,提案アルゴリズムの有効性を実証的に検証する。
いずれの設定においても,提案アルゴリズムは,SO(3)$空間で純粋に動作するアルゴリズムよりもはるかに高速に,一貫した相対配向フレームに収束できることを示す。
詳細はhttps://sites.google.com/view/deep-projective-rotation/home.comで確認できる。
関連論文リスト
- An Accurate and Real-time Relative Pose Estimation from Triple Point-line Images by Decoupling Rotation and Translation [10.05584976985694]
3D-2D制約は、Visual Odometry (VO) やStructure-from-Motion (SfM) システムで広く使われている。
回転変換デカップリング推定に基づく新しい3次元ポーズ解決器を提案する。
論文 参考訳(メタデータ) (2024-03-18T10:21:05Z) - Fixation-based Self-calibration for Eye Tracking in VR Headsets [0.21561701531034413]
提案手法は,ユーザの視点が自由に動けるという仮定に基づいている。
固定は、まず、補正されていない視線方向の時系列データから検出される。
キャリブレーションパラメータは、PoRsの分散メトリクスの和を最小化することにより最適化される。
論文 参考訳(メタデータ) (2023-11-01T09:34:15Z) - Neural Gradient Learning and Optimization for Oriented Point Normal
Estimation [53.611206368815125]
本研究では,3次元点雲から勾配ベクトルを一貫した向きで学習し,正規推定を行うためのディープラーニング手法を提案する。
局所平面幾何に基づいて角距離場を学習し、粗勾配ベクトルを洗練する。
本手法は,局所特徴記述の精度と能力の一般化を図りながら,グローバル勾配近似を効率的に行う。
論文 参考訳(メタデータ) (2023-09-17T08:35:11Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - The Probabilistic Normal Epipolar Constraint for Frame-To-Frame Rotation
Optimization under Uncertain Feature Positions [53.478856119297284]
特徴位置における異方性および不均一性を考慮した確率論的正規極性制約(PNEC)を導入する。
合成データの実験において、新しいPNECは元のNECよりも正確な回転推定値が得られることを示した。
我々は,提案手法を最先端のモノクロ回転専用オドメトリーシステムに統合し,実世界のKITTIデータセットに対して一貫した改良を行った。
論文 参考訳(メタデータ) (2022-04-05T14:47:11Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Amplifying the Anterior-Posterior Difference via Data Enhancement -- A
More Robust Deep Monocular Orientation Estimation Solution [7.540176446791261]
既存のディープラーニングベースの単眼方向推定アルゴリズムは、オブジェクトの前部と後部の混乱の問題に直面している。
本研究では,物体の向きが位置する左右半円を予測することに焦点を当てた事前学習手法を提案する。
実験の結果,提案する半円予測により方向推定の精度が向上し,上記の問題を緩和できることがわかった。
論文 参考訳(メタデータ) (2020-12-21T15:36:13Z) - DiSCO: Differentiable Scan Context with Orientation [13.797651328615347]
そこで我々は、LiDARに基づく位置認識手法、DiSCO(diffariable Scan Context with Orientation)を提案する。
同時にスキャンを同じ場所で見つけ、相対的な向きを推定する。
DiSCOは長期の屋外条件を持つ3つのデータセットで検証される。
論文 参考訳(メタデータ) (2020-10-21T12:38:21Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。