論文の概要: Handling Object Symmetries in CNN-based Pose Estimation
- arxiv url: http://arxiv.org/abs/2011.13209v2
- Date: Tue, 27 Apr 2021 07:24:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 12:16:01.568518
- Title: Handling Object Symmetries in CNN-based Pose Estimation
- Title(参考訳): CNNを用いたポーズ推定におけるオブジェクト対称性の扱い
- Authors: Jesse Richter-Klug and Udo Frese
- Abstract要約: 畳み込みニューラルネットワーク(CNN)に基づくポーズ推定器が対称オブジェクトを持つ問題について検討する。
特に、対称性を意識した損失を生成するための一般的なミニ・オーバー・対称性のアプローチは、勾配に基づく最適化ではうまくいかない傾向にある。
これらの知見から「閉対称性ループ」(csl)と呼ばれる表現を提案し、関連するベクトルの角度を対称性の順序に乗じて6-DOFに一般化する。
- 参考スコア(独自算出の注目度): 7.1577508803778045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate the problems that Convolutional Neural Networks
(CNN)-based pose estimators have with symmetric objects. We considered the
value of the CNN's output representation when continuously rotating the object
and found that it has to form a closed loop after each step of symmetry.
Otherwise, the CNN (which is itself a continuous function) has to replicate an
uncontinuous function. On a 1-DOF toy example we show that commonly used
representations do not fulfill this demand and analyze the problems caused
thereby. In particular, we find that the popular min-over-symmetries approach
for creating a symmetry-aware loss tends not to work well with gradient-based
optimization, i.e. deep learning.
We propose a representation called "closed symmetry loop" (csl) from these
insights, where the angle of relevant vectors is multiplied by the symmetry
order and then generalize it to 6-DOF. The representation extends our algorithm
from [Richter-Klug, ICVS, 2019] including a method to disambiguate symmetric
equivalents during the final pose estimation. The algorithm handles continuous
rotational symmetry (e.g. a bottle) and discrete rotational symmetry (e.g. a
4-fold symmetric box). It is evaluated on the T-LESS dataset, where it reaches
state-of-the-art for unrefining RGB-based methods.
- Abstract(参考訳): 本稿では,畳み込みニューラルネットワーク(cnn)に基づくポーズ推定器が対称対象を持つ問題について検討する。
対象を連続的に回転させるとき、cnnの出力表現の値は考慮され、対称性の各ステップの後に閉ループを形成する必要があることが判明した。
さもなければ、CNN(それ自体は連続関数)は不連続関数を複製しなければならない。
1自由のおもちゃの例では、一般的に使われる表現はこの要求を満たさないことを示し、その結果生じる問題を分析します。
特に、対称性を意識した損失を生み出すための一般的なmin-over-symmetriesアプローチは、勾配に基づく最適化、すなわちディープラーニングではうまく機能しない傾向がある。
これらの知見から「閉対称性ループ」(csl)と呼ばれる表現を提案し、関連するベクトルの角度を対称性の順序に乗じて6-DOFに一般化する。
この表現はアルゴリズムを[richter-klug, icvs, 2019]から拡張し、最終的なポーズ推定中に対称同値を曖昧化する方法を含む。
このアルゴリズムは連続的な回転対称性(例えばボトル)と離散的な回転対称性(例えば4倍対称箱)を扱う。
T-LESSデータセットで評価され、未精製のRGBベースのメソッドで最先端に達する。
関連論文リスト
- Resolving Symmetry Ambiguity in Correspondence-based Methods for Instance-level Object Pose Estimation [5.821462441570274]
物体表面を1対多の対応に基づいて符号化する対称認識曲面であるSymCodeを提案する。
また、問題の解決なしにオブジェクトの6Dポーズパラメータを直接回帰する高速なエンドツーエンドネットワークであるSymNetについても紹介する。
論文 参考訳(メタデータ) (2024-05-17T05:48:56Z) - Equivariant Symmetry Breaking Sets [0.6475999521931204]
等価ニューラルネットワーク(ENN)は、基礎となる対称性を含むアプリケーションに非常に効果的であることが示されている。
完全同変で、自発対称性の破れに対処する最初のフレームワークである新しい対称性破れフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-05T02:35:11Z) - Oracle-Preserving Latent Flows [58.720142291102135]
我々はラベル付きデータセット全体にわたって複数の非自明な連続対称性を同時に発見するための方法論を開発する。
対称性変換と対応するジェネレータは、特別に構築された損失関数で訓練された完全連結ニューラルネットワークでモデル化される。
この研究における2つの新しい要素は、縮小次元の潜在空間の使用と、高次元のオラクルに関して不変な変換への一般化である。
論文 参考訳(メタデータ) (2023-02-02T00:13:32Z) - Deep Learning Symmetries and Their Lie Groups, Algebras, and Subalgebras
from First Principles [55.41644538483948]
ラベル付きデータセットに存在する連続した対称性群の検出と同定のためのディープラーニングアルゴリズムを設計する。
完全に接続されたニューラルネットワークを用いて、変換対称性と対応するジェネレータをモデル化する。
また,Lie群とその性質の数学的研究に機械学習アプローチを使うための扉を開く。
論文 参考訳(メタデータ) (2023-01-13T16:25:25Z) - Breaking the Symmetry: Resolving Symmetry Ambiguities in Equivariant
Neural Networks [4.147346416230272]
OAVNN: Orientation Aware Vector Neuron Network, a extension of the Vector Neuron Network。
OAVNNは平面対称入力に対して堅牢な回転同変ネットワークである。
論文 参考訳(メタデータ) (2022-10-29T16:28:59Z) - When Random Tensors meet Random Matrices [50.568841545067144]
本稿では,ガウス雑音を伴う非対称次数-$d$スパイクテンソルモデルについて検討する。
検討したモデルの解析は、等価なスパイクされた対称テクシットブロック-ワイドランダム行列の解析に起因していることを示す。
論文 参考訳(メタデータ) (2021-12-23T04:05:01Z) - Robust Extrinsic Symmetry Estimation in 3D Point Clouds [4.416484585765027]
3次元点雲で表される物体の反射対称性面を検出することは、3次元コンピュータビジョンと幾何学処理の基本的な問題である。
本稿では,外乱や欠落部分に対して頑健な反射対称性の平面に対する統計的推定器に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-21T03:09:51Z) - Global Convergence of Gradient Descent for Asymmetric Low-Rank Matrix
Factorization [49.090785356633695]
非対称な低ランク分解問題: [mathbbRm min d , mathbfU$ および MathV$ について検討する。
論文 参考訳(メタデータ) (2021-06-27T17:25:24Z) - Detecting Symmetries with Neural Networks [0.0]
ニューラルネットワークの埋め込み層における構造を広範囲に活用する。
我々は、対称性が存在するかどうかを特定し、入力中の対称性の軌道を特定する。
この例では、グラフの観点で新しいデータ表現を示す。
論文 参考訳(メタデータ) (2020-03-30T17:58:24Z) - Semiparametric Nonlinear Bipartite Graph Representation Learning with
Provable Guarantees [106.91654068632882]
半パラメトリック指数族分布におけるパラメータの統計的推定問題として、両部グラフを考察し、その表現学習問題を定式化する。
提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。
我々の推定器は指数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証されている。
論文 参考訳(メタデータ) (2020-03-02T16:40:36Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。