Fugu-MT 論文翻訳(概要): Defining an action of SO(d)-rotations on images generated by projections of d-dimensional objects: Applications to pose inference with Geometric VAEs

論文の概要: Defining an action of SO(d)-rotations on images generated by projections of d-dimensional objects: Applications to pose inference with Geometric VAEs

arxiv url: http://arxiv.org/abs/2207.11582v1
Date: Sat, 23 Jul 2022 19:22:28 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-26 14:36:55.230285
Title: Defining an action of SO(d)-rotations on images generated by projections of d-dimensional objects: Applications to pose inference with Geometric VAEs
Title（参考訳）: d次元物体の投影により生成された画像に対するSO(d)-回転の作用の定義:幾何学的VAEを用いた推論への応用
Authors: Nicolas Legendre, Khanh Dao Duc, Nina Miolane
Abstract要約: データ空間上でのグループアクションを定義する試みは、ボリュームにより具体的な幾何学的制約を必要とするため、一般的に失敗する。幾何学的VAEを用いて、この制約が適切なポーズ推論の鍵であることを確認し、これらの結果の応用の可能性と今後の研究について論じる。
参考スコア（独自算出の注目度）: 3.867363075280544
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in variational autoencoders (VAEs) have enabled learning latent manifolds as compact Lie groups, such as $SO(d)$. Since this approach assumes that data lies on a subspace that is homeomorphic to the Lie group itself, we here investigate how this assumption holds in the context of images that are generated by projecting a $d$-dimensional volume with unknown pose in $SO(d)$. Upon examining different theoretical candidates for the group and image space, we show that the attempt to define a group action on the data space generally fails, as it requires more specific geometric constraints on the volume. Using geometric VAEs, our experiments confirm that this constraint is key to proper pose inference, and we discuss the potential of these results for applications and future work.
Abstract（参考訳）: 近年の変分オートエンコーダ(vaes)の進歩により、$so(d)$のようなコンパクトリー群として潜在多様体を学習できるようになった。このアプローチは、データはリー群自身に同型な部分空間上にあると仮定するので、この仮定は、$SO(d)$で未知のポーズを持つ$d$次元体積を射影することによって生成される画像の文脈においてどのように成立するかを考察する。群と画像空間の異なる理論的な候補を調べると、データ空間上の群作用を定義する試みは一般に失敗し、体積に対してより具体的な幾何学的制約を必要とする。幾何学的VAEを用いて、この制約が適切なポーズ推論の鍵であることを確認し、これらの結果の応用の可能性と今後の研究について論じる。

関連論文リスト

Estimating Dataset Dimension via Singular Metrics under the Manifold Hypothesis: Application to Inverse Problems [0.6138671548064356]
多様体の内在次元を推定し、適切な局所座標を構築し、周囲空間と多様体空間の間の写像を学習する3つの重要な課題に対処する枠組みを提案する。本稿では,VAEデコーダのプルバック値の数値ランクを解析することにより,データセットのIDを推定することに集中する。推定IDは、可逆なVAEの混合を用いた局所チャートのアトラスの構築をガイドし、正確な多様体パラメータ化と効率的な推論を可能にする。
論文参考訳（メタデータ） (2025-07-09T21:22:59Z)
Riemann$^2$: Learning Riemannian Submanifolds from Riemannian Data [12.424539896723603]
潜在変数モデルは、高次元データから低次元多様体を学習するための強力なツールである。本稿では,ロボットの動作合成や脳コネクトームの解析など,さまざまな領域における複雑なタスクの処理を可能にする。
論文参考訳（メタデータ） (2025-03-07T16:08:53Z)
GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Grounding [53.42728468191711]
Open-Vocabulary 3D object affordance groundingは、任意の命令で3Dオブジェクト上のアクション可能性の領域を予測することを目的としている。 GREAT (GeometRy-intEntion collAboraTive Inference) を提案する。
論文参考訳（メタデータ） (2024-11-29T11:23:15Z)
UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7128543480229]
単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。粗大なパラダイムに基づいて、UNOPoseはSE(3)不変の参照フレームを構築し、オブジェクト表現を標準化する。重なり合う領域内に存在すると予測される確率に基づいて、各対応の重みを補正する。
論文参考訳（メタデータ） (2024-11-25T05:36:00Z)
DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。本稿では,DVMNet(Deep Voxel Matching Network)を提案する。提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文参考訳（メタデータ） (2024-03-20T15:41:32Z)
Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文参考訳（メタデータ） (2024-02-03T19:00:19Z)
AEP$n$P: A Less-constrained EP$n$P Solver for Pose Estimation with Anisotropic Scaling [26.396201197991118]
そこで我々は,P$nP問題に制約を緩和し,正確な3次元座標の必要性を排除した新しい手法を提案する。古典的なEPn$Pソルバをベースとして、未知の異方性スケーリング因子を扱えるため、AEP$n$Pと呼ぶ。
論文参考訳（メタデータ） (2023-10-15T23:20:54Z)
A topological model for partial equivariance in deep learning and data analysis [0.0]
我々はP-GENEOsと呼ばれる演算子のクラスを導入し、測定によって表されるデータを非拡張的に変更する。そのような空間はどのように近似と凸性を持つかを示す。
論文参考訳（メタデータ） (2023-08-25T13:06:13Z)
Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文参考訳（メタデータ） (2023-07-11T16:51:38Z)
Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文参考訳（メタデータ） (2022-06-23T16:29:53Z)
Algebraic Machine Learning with an Application to Chemistry [0.0]
我々はスムーズな仮定に頼ることなく、微粒な幾何学的情報をキャプチャする機械学習パイプラインを開発した。特に,基礎変数の特異点近傍にある点を数値的に検出する手法を提案する。
論文参考訳（メタデータ） (2022-05-11T22:41:19Z)
FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文参考訳（メタデータ） (2022-03-28T10:31:29Z)
Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文参考訳（メタデータ） (2021-07-27T01:55:30Z)
The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文参考訳（メタデータ） (2021-01-15T07:57:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。