論文の概要: HybridPose: 6D Object Pose Estimation under Hybrid Representations
- arxiv url: http://arxiv.org/abs/2001.01869v4
- Date: Fri, 16 Oct 2020 04:34:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 20:42:57.193576
- Title: HybridPose: 6D Object Pose Estimation under Hybrid Representations
- Title(参考訳): HybridPose:ハイブリッド表現による6次元オブジェクトポス推定
- Authors: Chen Song, Jiaru Song, Qixing Huang
- Abstract要約: HybridPoseは、新しい6Dオブジェクトのポーズ推定アプローチである。
HybridPoseは、実行時間と精度が最先端のポーズ推定アプローチに匹敵する。
- 参考スコア(独自算出の注目度): 31.395826387805265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce HybridPose, a novel 6D object pose estimation approach.
HybridPose utilizes a hybrid intermediate representation to express different
geometric information in the input image, including keypoints, edge vectors,
and symmetry correspondences. Compared to a unitary representation, our hybrid
representation allows pose regression to exploit more and diverse features when
one type of predicted representation is inaccurate (e.g., because of
occlusion). Different intermediate representations used by HybridPose can all
be predicted by the same simple neural network, and outliers in predicted
intermediate representations are filtered by a robust regression module.
Compared to state-of-the-art pose estimation approaches, HybridPose is
comparable in running time and accuracy. For example, on Occlusion Linemod
dataset, our method achieves a prediction speed of 30 fps with a mean ADD(-S)
accuracy of 47.5%, representing a state-of-the-art performance. The
implementation of HybridPose is available at
https://github.com/chensong1995/HybridPose.
- Abstract(参考訳): 新しい6次元オブジェクトポーズ推定手法であるHybridPoseを紹介する。
HybridPoseはハイブリッド中間表現を使用して、入力画像内のキーポイント、エッジベクトル、対称性対応を含む異なる幾何学的情報を表現している。
ユニタリ表現と比較して、我々のハイブリッド表現は、ある種類の予測表現が不正確である場合(例えば、オクルージョンのため)、より多様な特徴を利用することができる。
HybridPoseで使用される異なる中間表現は、すべて同じ単純なニューラルネットワークで予測でき、予測中間表現の出力は堅牢な回帰モジュールによってフィルタリングされる。
最先端のポーズ推定アプローチと比較して、HybridPoseは実行時間と正確性に匹敵する。
例えば、Occlusion Linemod データセットでは、平均 ADD(-S) 精度が47.5% の予測速度を30 fps で達成し、最先端の性能を示す。
HybridPoseの実装はhttps://github.com/chensong1995/HybridPoseで公開されている。
関連論文リスト
- VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent Space [43.368963897752664]
この研究は、ヒューマン・ポースと形状推定の問題に対処する新しいパラダイムを導入している。
身体モデルパラメータを予測する代わりに、提案した離散潜在表現を予測することに重点を置いている。
提案モデルであるVQ-HPSはメッシュの離散潜在表現を予測する。
論文 参考訳(メタデータ) (2023-12-13T17:08:38Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - Pose Adaptive Dual Mixup for Few-Shot Single-View 3D Reconstruction [35.30827580375749]
単像3D再構成のためのポーズ適応型数ショット学習法と2段階データ正規化法を提案する。
PADMixは、ShapeNetデータセットよりも数ショット設定で過去の文献を著しく上回り、より困難な現実世界のPix3Dデータセットで新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2021-12-23T12:22:08Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - U-mesh: Human Correspondence Matching with Mesh Convolutional Networks [15.828285556159026]
本稿では,パラメータテンプレートモデルを生の走査メッシュに適合させるために,レグレッション(ボトムアップ)と生成(トップダウン)のエレガントな融合を提案する。
最初の大きな貢献は、テンプレート表面への点対応を予測する固有の畳み込みメッシュU-netアーキテクチャである。
FAUST対応課題に対する提案手法の評価を行い,対象者間対応技術の現状を20%(33%)改善する方法について検討した。
論文 参考訳(メタデータ) (2021-08-15T08:58:45Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - JGR-P2O: Joint Graph Reasoning based Pixel-to-Offset Prediction Network
for 3D Hand Pose Estimation from a Single Depth Image [28.753759115780515]
最先端の単一深度画像に基づく3次元手ポーズ推定法は、密集した予測に基づいている。
上記の問題に対処するために, 画素単位の予測に基づく新しい手法を提案する。
提案モデルは2次元完全畳み込みネットワークのバックボーンで実装され,約1.4Mのパラメータしか持たない。
論文 参考訳(メタデータ) (2020-07-09T08:57:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。