論文の概要: Defining an action of SO(d)-rotations on images generated by projections
of d-dimensional objects: Applications to pose inference with Geometric VAEs
- arxiv url: http://arxiv.org/abs/2207.11582v1
- Date: Sat, 23 Jul 2022 19:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:36:55.230285
- Title: Defining an action of SO(d)-rotations on images generated by projections
of d-dimensional objects: Applications to pose inference with Geometric VAEs
- Title(参考訳): d次元物体の投影により生成された画像に対するSO(d)-回転の作用の定義:幾何学的VAEを用いた推論への応用
- Authors: Nicolas Legendre, Khanh Dao Duc, Nina Miolane
- Abstract要約: データ空間上でのグループアクションを定義する試みは、ボリュームにより具体的な幾何学的制約を必要とするため、一般的に失敗する。
幾何学的VAEを用いて、この制約が適切なポーズ推論の鍵であることを確認し、これらの結果の応用の可能性と今後の研究について論じる。
- 参考スコア(独自算出の注目度): 3.867363075280544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in variational autoencoders (VAEs) have enabled learning
latent manifolds as compact Lie groups, such as $SO(d)$. Since this approach
assumes that data lies on a subspace that is homeomorphic to the Lie group
itself, we here investigate how this assumption holds in the context of images
that are generated by projecting a $d$-dimensional volume with unknown pose in
$SO(d)$. Upon examining different theoretical candidates for the group and
image space, we show that the attempt to define a group action on the data
space generally fails, as it requires more specific geometric constraints on
the volume. Using geometric VAEs, our experiments confirm that this constraint
is key to proper pose inference, and we discuss the potential of these results
for applications and future work.
- Abstract(参考訳): 近年の変分オートエンコーダ(vaes)の進歩により、$so(d)$のようなコンパクトリー群として潜在多様体を学習できるようになった。
このアプローチは、データはリー群自身に同型な部分空間上にあると仮定するので、この仮定は、$SO(d)$で未知のポーズを持つ$d$次元体積を射影することによって生成される画像の文脈においてどのように成立するかを考察する。
群と画像空間の異なる理論的な候補を調べると、データ空間上の群作用を定義する試みは一般に失敗し、体積に対してより具体的な幾何学的制約を必要とする。
幾何学的VAEを用いて、この制約が適切なポーズ推論の鍵であることを確認し、これらの結果の応用の可能性と今後の研究について論じる。
関連論文リスト
- UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7128543480229]
単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。
粗大なパラダイムに基づいて、UNOPoseはSE(3)不変の参照フレームを構築し、オブジェクト表現を標準化する。
重なり合う領域内に存在すると予測される確率に基づいて、各対応の重みを補正する。
論文 参考訳(メタデータ) (2024-11-25T05:36:00Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - AEP$n$P: A Less-constrained EP$n$P Solver for Pose Estimation with Anisotropic Scaling [26.396201197991118]
そこで我々は,P$nP問題に制約を緩和し,正確な3次元座標の必要性を排除した新しい手法を提案する。
古典的なEPn$Pソルバをベースとして、未知の異方性スケーリング因子を扱えるため、AEP$n$Pと呼ぶ。
論文 参考訳(メタデータ) (2023-10-15T23:20:54Z) - A topological model for partial equivariance in deep learning and data
analysis [0.0]
我々はP-GENEOsと呼ばれる演算子のクラスを導入し、測定によって表されるデータを非拡張的に変更する。
そのような空間はどのように近似と凸性を持つかを示す。
論文 参考訳(メタデータ) (2023-08-25T13:06:13Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Algebraic Machine Learning with an Application to Chemistry [0.0]
我々はスムーズな仮定に頼ることなく、微粒な幾何学的情報をキャプチャする機械学習パイプラインを開発した。
特に,基礎変数の特異点近傍にある点を数値的に検出する手法を提案する。
論文 参考訳(メタデータ) (2022-05-11T22:41:19Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-27T01:55:30Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。