論文の概要: Multimodal In-bed Pose and Shape Estimation under the Blankets
- arxiv url: http://arxiv.org/abs/2012.06735v1
- Date: Sat, 12 Dec 2020 05:35:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:13:16.798810
- Title: Multimodal In-bed Pose and Shape Estimation under the Blankets
- Title(参考訳): マルチモーダルインベッドポースとブランケット下の形状推定
- Authors: Yu Yin, Joseph P. Robinson, Yun Fu
- Abstract要約: マルチモーダルセンサが捉えた知識を最大限活用するために,様々なモダリティを融合するピラミッド方式を提案する。
我々は注意に基づく再構築モジュールを用いて検出されたモダリティを生成し,現在の推定値を更新するためにさらに融合する。
- 参考スコア(独自算出の注目度): 77.12439296395733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans spend vast hours in bed -- about one-third of the lifetime on average.
Besides, a human at rest is vital in many healthcare applications. Typically,
humans are covered by a blanket when resting, for which we propose a multimodal
approach to uncover the subjects so their bodies at rest can be viewed without
the occlusion of the blankets above. We propose a pyramid scheme to effectively
fuse the different modalities in a way that best leverages the knowledge
captured by the multimodal sensors. Specifically, the two most informative
modalities (i.e., depth and infrared images) are first fused to generate good
initial pose and shape estimation. Then pressure map and RGB images are further
fused one by one to refine the result by providing occlusion-invariant
information for the covered part, and accurate shape information for the
uncovered part, respectively. However, even with multimodal data, the task of
detecting human bodies at rest is still very challenging due to the extreme
occlusion of bodies. To further reduce the negative effects of the occlusion
from blankets, we employ an attention-based reconstruction module to generate
uncovered modalities, which are further fused to update current estimation via
a cyclic fashion. Extensive experiments validate the superiority of the
proposed model over others.
- Abstract(参考訳): 人間は生涯の約3分の1を平均してベッドで過ごす。
さらに、休息中の人間は多くの医療アプリケーションで不可欠です。
通常、人間は休んでいるときに毛布で覆われており、そこでは被写体を明らかにするためのマルチモーダルなアプローチを提案している。
本稿では,マルチモーダルセンサが捉えた知識を最大限活用するために,様々なモダリティを効果的に融合するピラミッド方式を提案する。
具体的には、最も情報性の高い2つのモード(すなわち深度と赤外画像)を最初に融合させ、優れた初期ポーズと形状推定を生成する。
そして、さらに圧力マップとrgb画像とを融合させ、被覆部に対する咬合不変情報と露出部に対する正確な形状情報とをそれぞれ提供して結果を洗練させる。
しかし、マルチモーダルデータであっても、身体の極端な閉塞のため、安静時に人体を検出する作業は依然として非常に困難である。
ブランケットからの閉塞による負の効果をさらに低減するため,我々は注意に基づく再構成モジュールを用いて未発見のモダリティを発生させ,サイクル方式で電流推定を更新する。
大規模な実験は、提案されたモデルが他よりも優れていることを検証する。
関連論文リスト
- DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.179287851188036]
人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文 参考訳(メタデータ) (2024-03-26T17:59:23Z) - In-Bed Pose Estimation: A Review [8.707107668375906]
ベッド内ポーズ推定は、患者の睡眠行動を監視し、潜在的な疾患の診断のために早期に症状を検出するために用いられる。
いくつかの研究は、ベッド内の人間のポーズを推定するために、一様および多様の手法を利用している。
本研究の目的は,従来の研究の限界,現状の課題,そしてベッド内人間のポーズ推定分野における今後の研究に対する洞察を提供することである。
論文 参考訳(メタデータ) (2024-02-01T15:57:11Z) - Explicit Occlusion Reasoning for Multi-person 3D Human Pose Estimation [33.86986028882488]
咬合は, 咬合者の形状, 外観, 位置の変動が大きいため, 単眼多面体3次元ポーズ推定において大きな脅威となる。
既存のメソッドは、ポーズ先/制約、データ拡張、暗黙の推論でオクルージョンを処理しようとする。
本研究では、ボトムアップ型多人数ポーズ推定を大幅に改善する、このプロセスを明示的にモデル化する手法を開発した。
論文 参考訳(メタデータ) (2022-07-29T22:12:50Z) - Occluded Human Mesh Recovery [23.63235079216075]
我々は、画像空間コンテキストを組み込んだ新しいトップダウンメッシュ回復アプローチであるOCHMR(Occluded Human Mesh Recovery)を提案する。
OCHMRは、3DPW、CrowdPose、OCHumanといった挑戦的なマルチパーソンベンチマークにおいて優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-03-24T21:39:20Z) - Privacy-Preserving In-Bed Pose Monitoring: A Fusion and Reconstruction
Study [9.474452908573111]
ベッド内ポーズ推定における複数の非視覚的・プライバシー保護的モダリティの画像の有効利用について検討する。
まず,様々な画像モダリティからの情報を効果的に融合し,より優れたポーズ推定を行う。
次に,可視画像が利用できない場合のベッド内ポーズ推定を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-22T07:24:21Z) - Towards Accurate Cross-Domain In-Bed Human Pose Estimation [3.685548851716087]
長波長赤外(LWIR)変調に基づくポーズ推定アルゴリズムは、上記の課題を克服する。
そこで本研究では,ドメイン間差を低減するために,2次元データ拡張による新たな学習戦略を提案する。
実験と分析により,複数の標準人のポーズ推定基準に対するアプローチの有効性が示された。
論文 参考訳(メタデータ) (2021-10-07T15:54:46Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - HEMlets PoSh: Learning Part-Centric Heatmap Triplets for 3D Human Pose
and Shape Estimation [60.35776484235304]
本研究は, 中間状態部分熱マップトリプレット(HEMlets)を導入し, 検出された2次元関節を三次元空間に持ち上げる不確実性に対処しようとするものである。
HEMletsは3つのジョイントヒートマップを使用して、各骨格体部に対するエンドジョイントの相対的な深さ情報を表す。
Convolutional Network (ConvNet) は、入力画像からHEMletを予測し、次にボリュームのジョイント・ヒートマップレグレッションを学習する。
論文 参考訳(メタデータ) (2020-03-10T04:03:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。