論文の概要: MetricHMR: Metric Human Mesh Recovery from Monocular Images
- arxiv url: http://arxiv.org/abs/2506.09919v1
- Date: Wed, 11 Jun 2025 16:39:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:03.131949
- Title: MetricHMR: Metric Human Mesh Recovery from Monocular Images
- Title(参考訳): MetricHMR:単眼画像からのMetric Human Meshリカバリ
- Authors: He Zhang, Chentao Song, Hongwen Zhang, Tao Yu,
- Abstract要約: MetricHMR (Metric Human Mesh Recovery) は、モノクロ画像からの正確なグローバル翻訳によって、人間のメッシュ回復を計測するためのアプローチである。
厳密なスケールと深さの曖昧さに苦しむ既存のHMR法とは対照的に,MetricHMRは再構成結果に幾何学的に合理的な身体形状と大域的な翻訳を生成することができる。
- 参考スコア(独自算出の注目度): 19.259836875933704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce MetricHMR (Metric Human Mesh Recovery), an approach for metric human mesh recovery with accurate global translation from monocular images. In contrast to existing HMR methods that suffer from severe scale and depth ambiguity, MetricHMR is able to produce geometrically reasonable body shape and global translation in the reconstruction results. To this end, we first systematically analyze previous HMR methods on camera models to emphasize the critical role of the standard perspective projection model in enabling metric-scale HMR. We then validate the acceptable ambiguity range of metric HMR under the standard perspective projection model. Finally, we contribute a novel approach that introduces a ray map based on the standard perspective projection to jointly encode bounding-box information, camera parameters, and geometric cues for End2End metric HMR without any additional metric-regularization modules. Extensive experiments demonstrate that our method achieves state-of-the-art performance, even compared with sequential HMR methods, in metric pose, shape, and global translation estimation across both indoor and in-the-wild scenarios.
- Abstract(参考訳): 本稿では,モノクロ画像からの正確な大域的翻訳によるヒトメッシュの回復手法であるMetricHMR(Metric Human Mesh Recovery)を紹介する。
厳密なスケールと深さの曖昧さに苦しむ既存のHMR法とは対照的に,MetricHMRは再構成結果に幾何学的に合理的な身体形状と大域的な翻訳を生成することができる。
そこで我々はまず,カメラモデルにおける従来のHMR手法を体系的に解析し,標準視点投影モデルが計量スケールのHMRを実現する上で重要な役割を担っていることを強調した。
次に、標準視点射影モデルに基づいて、計量HMRの許容あいまいさ範囲を検証した。
最後に,End2End 計量 HMR における境界ボックス情報,カメラパラメータ,幾何学的手がかりを,追加の計量正則化モジュールを使わずに共同で符号化する,標準的な視点射影に基づく光線マップを導入する手法を提案する。
提案手法は, 室内および室内の両方のシナリオにおいて, 距離ポーズ, 形状, 大域的翻訳推定において, 逐次HMR法と比較して, 最先端の性能を達成できることを実証した。
関連論文リスト
- Hybrid AI-Physical Modeling for Penetration Bias Correction in X-band InSAR DEMs: A Greenland Case Study [1.4711955189581167]
パラメトリック物理モデリングと機械学習を組み合わせた統合補正フレームワークを提案する。
TanDEM-Xデータを用いてグリーンランドの氷床実験を行った結果,提案したハイブリッドモデル補正はDEM誤差の平均偏差と標準偏差を著しく低減することがわかった。
論文 参考訳(メタデータ) (2025-04-11T18:24:22Z) - CT-SDM: A Sampling Diffusion Model for Sparse-View CT Reconstruction across All Sampling Rates [16.985836345715963]
Sparse view X-ray Computed tomography は放射線線量減少を緩和する現代的手法として登場した。
深層学習を用いた最近の研究は, Sparse-View Computed Tomography (SVCT) のアーティファクトの除去に有望な進展をもたらした。
本研究では,任意のサンプリングレートで高性能SVCT再構成を実現するための適応的再構成手法を提案する。
論文 参考訳(メタデータ) (2024-09-03T03:06:15Z) - Divide and Fuse: Body Part Mesh Recovery from Partially Visible Human Images [57.479339658504685]
ディバイドとフューズ」戦略は、人体部分を融合する前に独立して再構築する。
Human Part Parametric Models (HPPM) は、いくつかの形状とグローバルな位置パラメータからメッシュを独立に再構築する。
特別に設計された融合モジュールは、一部しか見えない場合でも、再建された部品をシームレスに統合する。
論文 参考訳(メタデータ) (2024-07-12T21:29:11Z) - Bi-level Guided Diffusion Models for Zero-Shot Medical Imaging Inverse Problems [4.82425721275731]
逆問題は、不完全でノイズの多い測定から高品質な画像を推測することを目的としている。
拡散モデルは最近、そのような実践的な課題に対する有望なアプローチとして現れました。
このアプローチにおける中心的な課題は、測定情報に従うために無条件の予測をどのように導くかである。
BGDM(UnderlinetextbfBi-level UnderlineGuided UnderlineDiffusion Underline Models)を提案する。
論文 参考訳(メタデータ) (2024-04-04T10:36:56Z) - Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image [85.91935485902708]
ゼロショット単視距離深度モデルの鍵は、大規模データトレーニングと様々なカメラモデルからの距離あいまいさの解消の組合せにあることを示す。
本稿では,あいまいさ問題に明示的に対処し,既存の単分子モデルにシームレスに接続可能な標準カメラ空間変換モジュールを提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2023-07-20T16:14:23Z) - MOSAIC: Masked Optimisation with Selective Attention for Image
Reconstruction [0.5541644538483947]
本研究では,無作為な計測値の選択を考慮に入れた画像再構成のための新しい圧縮センシングフレームワークを提案する。
MOSAICは、エンコードされた一連の測定に注意機構を効率的に適用するために埋め込み技術を採用している。
既存のCS再建手法の代替として,提案するアーキテクチャを検証した。
論文 参考訳(メタデータ) (2023-06-01T17:05:02Z) - PyMAF-X: Towards Well-aligned Full-body Model Regression from Monocular
Images [60.33197938330409]
PyMAF-Xは、モノクロ画像からパラメトリックフルボディモデルを復元するための回帰ベースのアプローチである。
PyMAFとPyMAF-Xは、メッシュイメージアライメントを効果的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2022-07-13T17:58:33Z) - MRI Reconstruction via Data Driven Markov Chain with Joint Uncertainty
Estimation [3.5751623095926806]
本稿では,MRI再構成のための学習確率分布からの効率的なサンプリングを可能にするフレームワークを提案する。
データ駆動型マルコフ連鎖は、所定の画像データベースから学習した生成モデルから構築される。
提案手法の性能は, 10倍の高速化獲得を用いて, オープンデータセット上で評価する。
論文 参考訳(メタデータ) (2022-02-03T09:13:49Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Solving Inverse Problems in Medical Imaging with Score-Based Generative
Models [87.48867245544106]
CT(Computed Tomography)とMRI(Magnetic Resonance Imaging)における医用画像の再構成は重要な逆問題である
機械学習に基づく既存のソリューションは通常、測定結果を医療画像に直接マッピングするモデルを訓練する。
本稿では,最近導入されたスコアベース生成モデルを利用して,逆問題解決のための教師なし手法を提案する。
論文 参考訳(メタデータ) (2021-11-15T05:41:12Z) - HEMlets PoSh: Learning Part-Centric Heatmap Triplets for 3D Human Pose
and Shape Estimation [60.35776484235304]
本研究は, 中間状態部分熱マップトリプレット(HEMlets)を導入し, 検出された2次元関節を三次元空間に持ち上げる不確実性に対処しようとするものである。
HEMletsは3つのジョイントヒートマップを使用して、各骨格体部に対するエンドジョイントの相対的な深さ情報を表す。
Convolutional Network (ConvNet) は、入力画像からHEMletを予測し、次にボリュームのジョイント・ヒートマップレグレッションを学習する。
論文 参考訳(メタデータ) (2020-03-10T04:03:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。