論文の概要: Defining an action of SO(d)-rotations on images generated by projections
of d-dimensional objects: Applications to pose inference with Geometric VAEs
- arxiv url: http://arxiv.org/abs/2207.11582v1
- Date: Sat, 23 Jul 2022 19:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:36:55.230285
- Title: Defining an action of SO(d)-rotations on images generated by projections
of d-dimensional objects: Applications to pose inference with Geometric VAEs
- Title(参考訳): d次元物体の投影により生成された画像に対するSO(d)-回転の作用の定義:幾何学的VAEを用いた推論への応用
- Authors: Nicolas Legendre, Khanh Dao Duc, Nina Miolane
- Abstract要約: データ空間上でのグループアクションを定義する試みは、ボリュームにより具体的な幾何学的制約を必要とするため、一般的に失敗する。
幾何学的VAEを用いて、この制約が適切なポーズ推論の鍵であることを確認し、これらの結果の応用の可能性と今後の研究について論じる。
- 参考スコア(独自算出の注目度): 3.867363075280544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in variational autoencoders (VAEs) have enabled learning
latent manifolds as compact Lie groups, such as $SO(d)$. Since this approach
assumes that data lies on a subspace that is homeomorphic to the Lie group
itself, we here investigate how this assumption holds in the context of images
that are generated by projecting a $d$-dimensional volume with unknown pose in
$SO(d)$. Upon examining different theoretical candidates for the group and
image space, we show that the attempt to define a group action on the data
space generally fails, as it requires more specific geometric constraints on
the volume. Using geometric VAEs, our experiments confirm that this constraint
is key to proper pose inference, and we discuss the potential of these results
for applications and future work.
- Abstract(参考訳): 近年の変分オートエンコーダ(vaes)の進歩により、$so(d)$のようなコンパクトリー群として潜在多様体を学習できるようになった。
このアプローチは、データはリー群自身に同型な部分空間上にあると仮定するので、この仮定は、$SO(d)$で未知のポーズを持つ$d$次元体積を射影することによって生成される画像の文脈においてどのように成立するかを考察する。
群と画像空間の異なる理論的な候補を調べると、データ空間上の群作用を定義する試みは一般に失敗し、体積に対してより具体的な幾何学的制約を必要とする。
幾何学的VAEを用いて、この制約が適切なポーズ推論の鍵であることを確認し、これらの結果の応用の可能性と今後の研究について論じる。
関連論文リスト
- A topological model for partial equivariance in deep learning and data
analysis [0.0]
我々はP-GENEOsと呼ばれる演算子のクラスを導入し、測定によって表されるデータを非拡張的に変更する。
そのような空間はどのように近似と凸性を持つかを示す。
論文 参考訳(メタデータ) (2023-08-25T13:06:13Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - The Union of Manifolds Hypothesis and its Implications for Deep
Generative Modelling [10.82459914543525]
多様体仮説は、データが低内在次元の未知の多様体上にあることを述べる。
我々は、この仮説が典型的にデータに存在する低次元構造を適切に捉えていないと論じる。
内在次元の高いクラスは分類が困難であること,また,この知見が分類精度の向上にどのように役立つかを示す。
論文 参考訳(メタデータ) (2022-07-06T18:00:00Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Algebraic Machine Learning with an Application to Chemistry [0.0]
我々はスムーズな仮定に頼ることなく、微粒な幾何学的情報をキャプチャする機械学習パイプラインを開発した。
特に,基礎変数の特異点近傍にある点を数値的に検出する手法を提案する。
論文 参考訳(メタデータ) (2022-05-11T22:41:19Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-27T01:55:30Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - Learning Spatial Context with Graph Neural Network for Multi-Person Pose
Grouping [71.59494156155309]
イメージベース多人数ポーズ推定のためのボトムアップ手法は,キーポイント検出とグループ化の2段階からなる。
本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。
学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
論文 参考訳(メタデータ) (2021-04-06T09:21:14Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。