Fugu-MT 論文翻訳(概要): Implicit-PDF: Non-Parametric Representation of Probability Distributions on the Rotation Manifold

論文の概要: Implicit-PDF: Non-Parametric Representation of Probability Distributions on the Rotation Manifold

arxiv url: http://arxiv.org/abs/2106.05965v1
Date: Thu, 10 Jun 2021 17:57:23 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-11 16:03:53.006158
Title: Implicit-PDF: Non-Parametric Representation of Probability Distributions on the Rotation Manifold
Title（参考訳）: Implicit-PDF:回転多様体上の確率分布の非パラメトリック表現
Authors: Kieran Murphy, Carlos Esteves, Varun Jampani, Srikumar Ramalingam, Ameesh Makadia
Abstract要約: 我々はSO(3)上の任意の非パラメトリック分布を推定する手法を提案する。私たちのキーとなるアイデアは、入力画像と候補ポーズの確率を推定するニューラルネットワークで、分布を暗黙的に表現することです。我々はPascal3D+とModelNet10-SO(3)ベンチマークの最先端性能を実現する。
参考スコア（独自算出の注目度）: 47.31074799708132
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Single image pose estimation is a fundamental problem in many vision and robotics tasks, and existing deep learning approaches suffer by not completely modeling and handling: i) uncertainty about the predictions, and ii) symmetric objects with multiple (sometimes infinite) correct poses. To this end, we introduce a method to estimate arbitrary, non-parametric distributions on SO(3). Our key idea is to represent the distributions implicitly, with a neural network that estimates the probability given the input image and a candidate pose. Grid sampling or gradient ascent can be used to find the most likely pose, but it is also possible to evaluate the probability at any pose, enabling reasoning about symmetries and uncertainty. This is the most general way of representing distributions on manifolds, and to showcase the rich expressive power, we introduce a dataset of challenging symmetric and nearly-symmetric objects. We require no supervision on pose uncertainty -- the model trains only with a single pose per example. Nonetheless, our implicit model is highly expressive to handle complex distributions over 3D poses, while still obtaining accurate pose estimation on standard non-ambiguous environments, achieving state-of-the-art performance on Pascal3D+ and ModelNet10-SO(3) benchmarks.
Abstract（参考訳）: 単一画像のポーズ推定は多くの視覚やロボティクスのタスクにおいて基本的な問題であり、既存のディープラーニングアプローチは、完全にモデリングやハンドリングに苦しむ:i)予測の不確実性、i)複数の(時には無限)正しいポーズを持つ対称オブジェクト。そこで本研究では,SO(3)上の任意の非パラメトリック分布を推定する手法を提案する。私たちのキーとなるアイデアは、入力画像と候補ポーズの確率を推定するニューラルネットワークで、分布を暗黙的に表現することです。グリッドサンプリングや勾配上昇は最も可能性の高いポーズを見つけるために用いられるが、任意のポーズで確率を評価することもでき、対称性や不確実性についての推論を可能にする。これは多様体上の分布を表現する最も一般的な方法であり、豊かな表現力を示すために、対称でほぼ対称な物体のデータセットを導入する。ポーズの不確実性に関する監督は必要ありません -- モデルでは、例毎に1つのポーズのみをトレーニングします。それにもかかわらず、我々の暗黙のモデルは、3dポーズ上の複雑な分布を扱うために非常に表現力があり、標準の非曖昧な環境で正確なポーズ推定を得て、pascal3d+とmodelnet10-so(3)ベンチマークで最先端のパフォーマンスを達成しています。

関連論文リスト

SE(3)-PoseFlow: Estimating 6D Pose Distributions for Uncertainty-Aware Robotic Manipulation [21.433019604658366]
本稿では,SE(3)多様体上のフローマッチングを利用して6次元オブジェクトのポーズ分布を推定する新しい確率的フレームワークを提案する。我々はReal275、YCB-V、LM-Oの最先端の成果を達成し、下流ロボット操作タスクにおいてサンプルベースのポーズ推定がどのように活用できるかを実証した。
論文参考訳（メタデータ） (2025-11-03T12:11:35Z)
ProPLIKS: Probablistic 3D human body pose estimation [7.397323069796547]
本稿では,確率論的モデルを用いた3次元人間のポーズ推定手法を提案する。具体的には,SO(3)回転群に配向した流れを正規化し,M"オビウス変換に基づく結合機構を組み込む。また,これらの入力を様々なポーズにマッピングする作業として,2次元画素配列の入力から3次元人物を再構成する課題を再解釈する。
論文参考訳（メタデータ） (2024-12-05T23:21:05Z)
ADen: Adaptive Density Representations for Sparse-view Camera Pose Estimation [17.097170273209333]
画像からカメラのポーズを復元することは、3Dコンピュータビジョンの基本課題である。最近のデータ駆動型アプローチは、6DoFカメラのポーズを後退させたり、回転を確率分布として定式化したりすることで、カメラのポーズを直接出力することを目指している。本稿では, ジェネレータと識別器を用いて2つのフレームワークを統合することを提案する。
論文参考訳（メタデータ） (2024-08-16T22:45:46Z)
ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文参考訳（メタデータ） (2023-12-11T13:50:10Z)
DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。 DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文参考訳（メタデータ） (2022-11-29T18:55:13Z)
Learning Implicit Probability Distribution Functions for Symmetric Orientation Estimation from RGB Images Without Pose Labels [23.01797447932351]
RGB-D画像の自動ポーズラベリング方式を提案する。我々は、RGB画像の向き仮説の確率を推定するために、インプリシットPDFモデルを訓練する。 SO(3)多様体の効率的な階層的サンプリングは、完備な対称性の集合を抽出可能な生成を可能にする。
論文参考訳（メタデータ） (2022-11-21T12:07:40Z)
HandFlow: Quantifying View-Dependent 3D Ambiguity in Two-Hand Reconstruction with Normalizing Flow [73.7895717883622]
条件付き正規化フローフレームワークにおける可塑性再構成の分布を明示的にモデル化する。この課題に対して,明示的な曖昧さモデリングが適していることを示す。
論文参考訳（メタデータ） (2022-10-04T15:42:22Z)
Ki-Pode: Keypoint-based Implicit Pose Distribution Estimation of Rigid Objects [1.209625228546081]
本稿では,新しいポーズ分布推定法を提案する。オブジェクトのポーズ上の確率分布の暗黙的な定式化は、キーポイントの集合としてのオブジェクトの中間表現から導かれる。本手法は,YCB-VおよびT-LESSデータセット上での回転分布推定のタスクに基づいて評価されている。
論文参考訳（メタデータ） (2022-09-20T11:59:05Z)
Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文参考訳（メタデータ） (2022-03-29T07:14:58Z)
NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文参考訳（メタデータ） (2022-02-07T12:30:45Z)
PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文参考訳（メタデータ） (2021-09-28T17:56:41Z)
Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文参考訳（メタデータ） (2021-08-26T17:55:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。