論文の概要: MetricHMR: Metric Human Mesh Recovery from Monocular Images
- arxiv url: http://arxiv.org/abs/2506.09919v1
- Date: Wed, 11 Jun 2025 16:39:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:03.131949
- Title: MetricHMR: Metric Human Mesh Recovery from Monocular Images
- Title(参考訳): MetricHMR:単眼画像からのMetric Human Meshリカバリ
- Authors: He Zhang, Chentao Song, Hongwen Zhang, Tao Yu,
- Abstract要約: MetricHMR (Metric Human Mesh Recovery) は、モノクロ画像からの正確なグローバル翻訳によって、人間のメッシュ回復を計測するためのアプローチである。
厳密なスケールと深さの曖昧さに苦しむ既存のHMR法とは対照的に,MetricHMRは再構成結果に幾何学的に合理的な身体形状と大域的な翻訳を生成することができる。
- 参考スコア(独自算出の注目度): 19.259836875933704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce MetricHMR (Metric Human Mesh Recovery), an approach for metric human mesh recovery with accurate global translation from monocular images. In contrast to existing HMR methods that suffer from severe scale and depth ambiguity, MetricHMR is able to produce geometrically reasonable body shape and global translation in the reconstruction results. To this end, we first systematically analyze previous HMR methods on camera models to emphasize the critical role of the standard perspective projection model in enabling metric-scale HMR. We then validate the acceptable ambiguity range of metric HMR under the standard perspective projection model. Finally, we contribute a novel approach that introduces a ray map based on the standard perspective projection to jointly encode bounding-box information, camera parameters, and geometric cues for End2End metric HMR without any additional metric-regularization modules. Extensive experiments demonstrate that our method achieves state-of-the-art performance, even compared with sequential HMR methods, in metric pose, shape, and global translation estimation across both indoor and in-the-wild scenarios.
- Abstract(参考訳): 本稿では,モノクロ画像からの正確な大域的翻訳によるヒトメッシュの回復手法であるMetricHMR(Metric Human Mesh Recovery)を紹介する。
厳密なスケールと深さの曖昧さに苦しむ既存のHMR法とは対照的に,MetricHMRは再構成結果に幾何学的に合理的な身体形状と大域的な翻訳を生成することができる。
そこで我々はまず,カメラモデルにおける従来のHMR手法を体系的に解析し,標準視点投影モデルが計量スケールのHMRを実現する上で重要な役割を担っていることを強調した。
次に、標準視点射影モデルに基づいて、計量HMRの許容あいまいさ範囲を検証した。
最後に,End2End 計量 HMR における境界ボックス情報,カメラパラメータ,幾何学的手がかりを,追加の計量正則化モジュールを使わずに共同で符号化する,標準的な視点射影に基づく光線マップを導入する手法を提案する。
提案手法は, 室内および室内の両方のシナリオにおいて, 距離ポーズ, 形状, 大域的翻訳推定において, 逐次HMR法と比較して, 最先端の性能を達成できることを実証した。
関連論文リスト
- Gamma-from-Mono: Road-Relative, Metric, Self-Supervised Monocular Geometry for Vehicular Applications [2.9457242478147503]
本稿では,軽量な単分子幾何推定法であるGamma-from-Mono (GfM)を紹介する。
GfMはガンマで表される残差とともに支配的な道路面を予測する。
地上のカメラの高さだけで、GfMは決定論的に閉じた形を通してメートル法的な深さを回復する。
論文 参考訳(メタデータ) (2025-12-03T22:37:38Z) - GeoDiff: Geometry-Guided Diffusion for Metric Depth Estimation [25.50613737995557]
本稿では,立体視誘導を用いた拡散型単分子深度推定(DB-MDE)モデルの改良を目的とした,距離深度推定のための新しいフレームワークを提案する。
トレーニングフリーのソリューションは既存のDB-MDEフレームワークとシームレスに統合され、屋内、屋外、複雑な環境にまたがって一般化されます。
論文 参考訳(メタデータ) (2025-10-21T04:47:36Z) - Gaussian Alignment for Relative Camera Pose Estimation via Single-View Reconstruction [18.936573991468926]
GARPSは、2つの独立して再構成された3Dシーンの直接的なアライメントとしてこの問題を論じる、トレーニング不要のフレームワークである。
差分可能なGMMアライメント目標を最適化することにより、フィードフォワード2ビューポーズ推定器の初期ポーズを洗練する。
Real-Estate10Kデータセットの実験では、GARPSが古典的および最先端の学習ベースの手法よりも優れていることが示されている。
論文 参考訳(メタデータ) (2025-09-17T02:57:34Z) - Benchmarking Dimensionality Reduction Techniques for Spatial Transcriptomics [0.0]
本研究では,空間転写学における次元削減手法の評価のための統一的な枠組みを提案する。
胆管癌Xeniumデータセット上に,PCA,NMF,オートエンコーダ,VAE,ハイブリッド埋め込みの6つの手法をベンチマークした。
論文 参考訳(メタデータ) (2025-09-12T17:27:34Z) - Hybrid AI-Physical Modeling for Penetration Bias Correction in X-band InSAR DEMs: A Greenland Case Study [1.4711955189581167]
パラメトリック物理モデリングと機械学習を組み合わせた統合補正フレームワークを提案する。
TanDEM-Xデータを用いてグリーンランドの氷床実験を行った結果,提案したハイブリッドモデル補正はDEM誤差の平均偏差と標準偏差を著しく低減することがわかった。
論文 参考訳(メタデータ) (2025-04-11T18:24:22Z) - CT-SDM: A Sampling Diffusion Model for Sparse-View CT Reconstruction across All Sampling Rates [16.985836345715963]
Sparse view X-ray Computed tomography は放射線線量減少を緩和する現代的手法として登場した。
深層学習を用いた最近の研究は, Sparse-View Computed Tomography (SVCT) のアーティファクトの除去に有望な進展をもたらした。
本研究では,任意のサンプリングレートで高性能SVCT再構成を実現するための適応的再構成手法を提案する。
論文 参考訳(メタデータ) (2024-09-03T03:06:15Z) - Divide and Fuse: Body Part Mesh Recovery from Partially Visible Human Images [57.479339658504685]
ディバイドとフューズ」戦略は、人体部分を融合する前に独立して再構築する。
Human Part Parametric Models (HPPM) は、いくつかの形状とグローバルな位置パラメータからメッシュを独立に再構築する。
特別に設計された融合モジュールは、一部しか見えない場合でも、再建された部品をシームレスに統合する。
論文 参考訳(メタデータ) (2024-07-12T21:29:11Z) - Bi-level Guided Diffusion Models for Zero-Shot Medical Imaging Inverse Problems [4.82425721275731]
逆問題は、不完全でノイズの多い測定から高品質な画像を推測することを目的としている。
拡散モデルは最近、そのような実践的な課題に対する有望なアプローチとして現れました。
このアプローチにおける中心的な課題は、測定情報に従うために無条件の予測をどのように導くかである。
BGDM(UnderlinetextbfBi-level UnderlineGuided UnderlineDiffusion Underline Models)を提案する。
論文 参考訳(メタデータ) (2024-04-04T10:36:56Z) - Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image [85.91935485902708]
ゼロショット単視距離深度モデルの鍵は、大規模データトレーニングと様々なカメラモデルからの距離あいまいさの解消の組合せにあることを示す。
本稿では,あいまいさ問題に明示的に対処し,既存の単分子モデルにシームレスに接続可能な標準カメラ空間変換モジュールを提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2023-07-20T16:14:23Z) - MOSAIC: Masked Optimisation with Selective Attention for Image
Reconstruction [0.5541644538483947]
本研究では,無作為な計測値の選択を考慮に入れた画像再構成のための新しい圧縮センシングフレームワークを提案する。
MOSAICは、エンコードされた一連の測定に注意機構を効率的に適用するために埋め込み技術を採用している。
既存のCS再建手法の代替として,提案するアーキテクチャを検証した。
論文 参考訳(メタデータ) (2023-06-01T17:05:02Z) - PyMAF-X: Towards Well-aligned Full-body Model Regression from Monocular
Images [60.33197938330409]
PyMAF-Xは、モノクロ画像からパラメトリックフルボディモデルを復元するための回帰ベースのアプローチである。
PyMAFとPyMAF-Xは、メッシュイメージアライメントを効果的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2022-07-13T17:58:33Z) - MRI Reconstruction via Data Driven Markov Chain with Joint Uncertainty
Estimation [3.5751623095926806]
本稿では,MRI再構成のための学習確率分布からの効率的なサンプリングを可能にするフレームワークを提案する。
データ駆動型マルコフ連鎖は、所定の画像データベースから学習した生成モデルから構築される。
提案手法の性能は, 10倍の高速化獲得を用いて, オープンデータセット上で評価する。
論文 参考訳(メタデータ) (2022-02-03T09:13:49Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Solving Inverse Problems in Medical Imaging with Score-Based Generative
Models [87.48867245544106]
CT(Computed Tomography)とMRI(Magnetic Resonance Imaging)における医用画像の再構成は重要な逆問題である
機械学習に基づく既存のソリューションは通常、測定結果を医療画像に直接マッピングするモデルを訓練する。
本稿では,最近導入されたスコアベース生成モデルを利用して,逆問題解決のための教師なし手法を提案する。
論文 参考訳(メタデータ) (2021-11-15T05:41:12Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - HEMlets PoSh: Learning Part-Centric Heatmap Triplets for 3D Human Pose
and Shape Estimation [60.35776484235304]
本研究は, 中間状態部分熱マップトリプレット(HEMlets)を導入し, 検出された2次元関節を三次元空間に持ち上げる不確実性に対処しようとするものである。
HEMletsは3つのジョイントヒートマップを使用して、各骨格体部に対するエンドジョイントの相対的な深さ情報を表す。
Convolutional Network (ConvNet) は、入力画像からHEMletを予測し、次にボリュームのジョイント・ヒートマップレグレッションを学習する。
論文 参考訳(メタデータ) (2020-03-10T04:03:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。