論文の概要: Multi-view Human Pose and Shape Estimation Using Learnable Volumetric
Aggregation
- arxiv url: http://arxiv.org/abs/2011.13427v1
- Date: Thu, 26 Nov 2020 18:33:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 09:13:55.879313
- Title: Multi-view Human Pose and Shape Estimation Using Learnable Volumetric
Aggregation
- Title(参考訳): 学習可能なボリュームアグリゲーションを用いた多視点人文と形状推定
- Authors: Soyong Shin, Eni Halilaj
- Abstract要約: キャリブレーションされた多視点画像から3次元人体ポーズと形状を再構成する学習可能なアグリゲーション手法を提案する。
従来の手法と比較して,我々のフレームワークは,コスト効率を考えると,より精度が高く,リアルタイムな予測が期待できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human pose and shape estimation from RGB images is a highly sought after
alternative to marker-based motion capture, which is laborious, requires
expensive equipment, and constrains capture to laboratory environments.
Monocular vision-based algorithms, however, still suffer from rotational
ambiguities and are not ready for translation in healthcare applications, where
high accuracy is paramount. While fusion of data from multiple viewpoints could
overcome these challenges, current algorithms require further improvement to
obtain clinically acceptable accuracies. In this paper, we propose a learnable
volumetric aggregation approach to reconstruct 3D human body pose and shape
from calibrated multi-view images. We use a parametric representation of the
human body, which makes our approach directly applicable to medical
applications. Compared to previous approaches, our framework shows higher
accuracy and greater promise for real-time prediction, given its cost
efficiency.
- Abstract(参考訳): RGB画像からの人間のポーズと形状の推定は、マーカーベースのモーションキャプチャーの代替として非常に求められており、それは面倒であり、高価な機器を必要とし、実験室環境に制約を課している。
しかし、単眼の視覚に基づくアルゴリズムはまだ回転の曖昧さに悩まされており、高い精度が最重要である医療アプリケーションでは翻訳の準備ができていない。
複数の視点からのデータの融合はこれらの課題を克服する可能性があるが、現在のアルゴリズムは臨床上許容できる精度を得るためにさらなる改善が必要である。
本稿では,多視点画像のキャリブレーションから3次元人体のポーズと形状を再構成する学習可能なボリュームアグリゲーション手法を提案する。
我々は人体のパラメトリックな表現を用いて、我々のアプローチを直接医療応用に適用する。
従来の手法と比較すると,提案手法はコスト効率を考慮し,高い精度とリアルタイム予測への期待を示す。
関連論文リスト
- Enhancing Quantitative Image Synthesis through Pretraining and Resolution Scaling for Bone Mineral Density Estimation from a Plain X-ray Image [7.832005676209272]
本研究の目的は、事前学習と画像分解能のスケーリングを探索することで、定量的画像合成(QIS)を改善することである。
原X線画像からのQISに基づく骨密度推定のタスクを用いて,プレトレーニング性能を評価するためのベンチマークを提案する。
論文 参考訳(メタデータ) (2024-07-30T01:39:30Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - ShaRPy: Shape Reconstruction and Hand Pose Estimation from RGB-D with
Uncertainty [6.559796851992517]
本稿では,最初のRGB-D形状再構成システムであるShaRPyを提案する。
ShaRPyはパーソナライズされた手の形を近似し、デジタルツインのより現実的で直感的な理解を促進する。
キーポイント検出ベンチマークを用いてShaRPyを評価し,筋骨格疾患の能動モニタリングのための手機能評価の質的結果を示した。
論文 参考訳(メタデータ) (2023-03-17T15:12:25Z) - Localizing Scan Targets from Human Pose for Autonomous Lung Ultrasound
Imaging [61.60067283680348]
新型コロナウイルス(COVID-19)の世界的なパンデミックの出現に伴い、超音波画像を完全に自動化する必要がある。
本稿では,学習型コンピュータビジョン技術を取り入れた,視覚に基づくデータ駆動方式を提案する。
本手法は、プローブ位置決めのための15.52mm(9.47mm)、プローブ方位のための4.32(3.69deg)の精度を達成し、全走査目標に対する誤差閾値25mm以下で成功率を80%以上とした。
論文 参考訳(メタデータ) (2022-12-15T14:34:12Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - Learning stochastic object models from medical imaging measurements by
use of advanced AmbientGANs [7.987904193401004]
GAN(Generative Adversarial Network)は、そのようなタスクの可能性を秘めている。
GAN(Generative Adversarial Network)のような深層生成ニューラルネットワークは、そのようなタスクの可能性を秘めている。
本研究では,現代進行的・多分解能的な訓練手法に適した改良型アンビエントGANトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-06-27T21:46:23Z) - 3D Human Body Reshaping with Anthropometric Modeling [59.51820187982793]
人間測定パラメータから正確で現実的な3D人体を再構築することは、個人識別、オンラインショッピング、仮想現実のための基本的な課題です。
このような3d形状を作る既存のアプローチは、レンジカメラやハイエンドスキャナーによる複雑な測定に苦しむことが多い。
本稿では,各ファセットに対する自動人為的パラメータモデリングを可能にする,特徴選択に基づく局所マッピング手法を提案する。
論文 参考訳(メタデータ) (2021-04-05T04:09:39Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Learning stochastic object models from medical imaging measurements
using Progressively-Growing AmbientGANs [14.501812971529137]
オブザーバのパフォーマンスを著しく制限できる変数の重要な源は、イメージすべきオブジェクトのバリエーションである。
良好なキャラクタライズドイメージングシステムを用いて得られた実験画像計測からSOMを確立することが望ましい。
GAN(Generative Adversarial Network)のような深層生成ニューラルネットワークは、このタスクに大きな可能性を秘めている。
論文 参考訳(メタデータ) (2020-05-29T18:45:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。