論文の概要: A Smooth Representation of Belief over SO(3) for Deep Rotation Learning
with Uncertainty
- arxiv url: http://arxiv.org/abs/2006.01031v4
- Date: Sun, 17 Jan 2021 19:47:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 06:31:30.298709
- Title: A Smooth Representation of Belief over SO(3) for Deep Rotation Learning
with Uncertainty
- Title(参考訳): 不確かさを伴う深部回転学習のためのSO(3)上の信念の平滑表現
- Authors: Valentin Peretroukhin, Matthew Giamou, David M. Rosen, W. Nicholas
Greene, Nicholas Roy, Jonathan Kelly
- Abstract要約: 本稿では、3次元回転群の新しい対称行列表現 SO(3) と、学習モデルに特に適する2つの重要な性質について述べる。
我々は,2つのデータモダリティに基づいて深部神経回転回帰器を訓練することにより,定式化の利点を実証的に検証した。
この機能は、新しい入力を検出することで、学習したモデルの破滅的な失敗を防ぐ安全クリティカルなアプリケーションにとって鍵となる。
- 参考スコア(独自算出の注目度): 33.627068152037815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate rotation estimation is at the heart of robot perception tasks such
as visual odometry and object pose estimation. Deep neural networks have
provided a new way to perform these tasks, and the choice of rotation
representation is an important part of network design. In this work, we present
a novel symmetric matrix representation of the 3D rotation group, SO(3), with
two important properties that make it particularly suitable for learned models:
(1) it satisfies a smoothness property that improves convergence and
generalization when regressing large rotation targets, and (2) it encodes a
symmetric Bingham belief over the space of unit quaternions, permitting the
training of uncertainty-aware models. We empirically validate the benefits of
our formulation by training deep neural rotation regressors on two data
modalities. First, we use synthetic point-cloud data to show that our
representation leads to superior predictive accuracy over existing
representations for arbitrary rotation targets. Second, we use image data
collected onboard ground and aerial vehicles to demonstrate that our
representation is amenable to an effective out-of-distribution (OOD) rejection
technique that significantly improves the robustness of rotation estimates to
unseen environmental effects and corrupted input images, without requiring the
use of an explicit likelihood loss, stochastic sampling, or an auxiliary
classifier. This capability is key for safety-critical applications where
detecting novel inputs can prevent catastrophic failure of learned models.
- Abstract(参考訳): 正確な回転推定は、視覚計測やオブジェクトポーズ推定といったロボット知覚タスクの中心にある。
ディープニューラルネットワークはこれらのタスクを実行する新しい方法を提供しており、回転表現の選択はネットワーク設計の重要な部分である。
本研究では、3次元回転群の新しい対称行列表現SO(3)を学習モデルに特に適する2つの重要な特性として提示する:(1)大きな回転対象を回帰する際に収束と一般化を改善する滑らか性特性、(2)単位四元数空間上の対称ビンガムの信念を符号化し、不確実性を考慮したモデルの訓練を可能にする。
2つのデータモダリティに基づいてディープニューラルローテーションレセプタを訓練することにより,この定式化の利点を実証的に検証した。
まず, 任意の回転対象に対する既存の表現よりも予測精度が優れていることを示すために, 合成点クラウドデータを用いる。
第2に, 地上および航空機で収集した画像データを用いて, 自在な確率的損失, 確率的サンプリング, 補助分類器を使わずに, 自転推定のロバスト性を大幅に向上させ, 環境影響や破損した入力画像の再現性を高める効果的なアウト・オブ・ディストリビューション(ood)拒絶技術に, 当社の表現が適していることを示す。
この機能は、新しい入力を検出することで、学習したモデルの破滅的な失敗を防ぐ安全クリティカルなアプリケーションにとって鍵となる。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - VI-Net: Boosting Category-level 6D Object Pose Estimation via Learning
Decoupled Rotations on the Spherical Representations [55.25238503204253]
作業を容易にするために,VI-Netと呼ばれる新しい回転推定ネットワークを提案する。
球面信号を処理するために、SPAtial Spherical Convolutionの新たな設計に基づいて、球面特徴ピラミッドネットワークを構築する。
ベンチマークデータセットの実験により,提案手法の有効性が確認された。
論文 参考訳(メタデータ) (2023-08-19T05:47:53Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Triangle-Net: Towards Robustness in Point Cloud Learning [0.0]
本稿では, 回転, 位置シフト, スケーリングに対する不変性を同時に実現し, 点間隔に頑健な3次元分類手法を提案する。
提案手法は,ModelNet 40分類タスクにおいて,ポイントネットと3DmFVをそれぞれ35.0%,28.1%で上回っている。
論文 参考訳(メタデータ) (2020-02-27T20:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。