論文の概要: Simultaneously-Collected Multimodal Lying Pose Dataset: Towards In-Bed
Human Pose Monitoring under Adverse Vision Conditions
- arxiv url: http://arxiv.org/abs/2008.08735v1
- Date: Thu, 20 Aug 2020 02:20:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 03:42:27.128730
- Title: Simultaneously-Collected Multimodal Lying Pose Dataset: Towards In-Bed
Human Pose Monitoring under Adverse Vision Conditions
- Title(参考訳): 同時に収集されたマルチモーダルライディングポーズデータセット--ベッド内ポーズモニタリングに向けて-
- Authors: Shuangjun Liu, Xiaofei Huang, Nihang Fu, Cheng Li, Zhongnan Su, and
Sarah Ostadabbas
- Abstract要約: ベッド内の人間のポーズ推定は多くの医療応用において重要な価値を持っている。
本稿では,同時コンパイル型マルチモーダルLying Poseデータセットについて紹介する。
現状の2Dポーズ推定モデルは,PCKh@0.5において最大95%の性能を期待できるSLPデータを用いて,単一モードで効果的に訓練できることを示す。
- 参考スコア(独自算出の注目度): 15.12849597272402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computer vision (CV) has achieved great success in interpreting semantic
meanings from images, yet CV algorithms can be brittle for tasks with adverse
vision conditions and the ones suffering from data/label pair limitation. One
of this tasks is in-bed human pose estimation, which has significant values in
many healthcare applications. In-bed pose monitoring in natural settings could
involve complete darkness or full occlusion. Furthermore, the lack of publicly
available in-bed pose datasets hinders the use of many successful pose
estimation algorithms for this task. In this paper, we introduce our
Simultaneously-collected multimodal Lying Pose (SLP) dataset, which includes
in-bed pose images from 109 participants captured using multiple imaging
modalities including RGB, long wave infrared, depth, and pressure map. We also
present a physical hyper parameter tuning strategy for ground truth pose label
generation under extreme conditions such as lights off and being fully covered
by a sheet/blanket. SLP design is compatible with the mainstream human pose
datasets, therefore, the state-of-the-art 2D pose estimation models can be
trained effectively with SLP data with promising performance as high as 95% at
PCKh@0.5 on a single modality. The pose estimation performance can be further
improved by including additional modalities through collaboration.
- Abstract(参考訳): コンピュータビジョン(cv)は、画像から意味的な意味を解釈することに成功したが、cvアルゴリズムは、悪い視覚条件やデータ/ラベルペアの制限に苦しむタスクに対して脆弱である。
このタスクの1つは、ベッド内の人間のポーズ推定であり、多くの医療アプリケーションで重要な価値を持っている。
自然環境におけるベッド内ポーズ監視は、完全な暗闇や完全な閉塞を伴う可能性がある。
さらに、一般に利用可能なベッド内ポーズデータセットの欠如は、このタスクに多くの成功したポーズ推定アルゴリズムの使用を妨げている。
本稿では, rgb, 長波赤外, 深度, 圧力マップなど複数の画像モダリティを用いて撮影された109名の被験者のベッド内ポーズ画像を含む, 同時集合型マルチモーダルライディングポーズ(slp)データセットを提案する。
また,光の消灯やシート/ブランケットの完全被覆といった極端な条件下での地中真理ポーズラベル生成のための物理パラメータ調整手法を提案する。
SLP設計は、主流の人間のポーズデータセットと互換性があるため、最先端の2Dポーズ推定モデルは、単一のモードでPCKh@0.5で最大95%の性能でSLPデータで効果的に訓練することができる。
協調により追加のモダリティを含めることで、ポーズ推定性能をさらに向上することができる。
関連論文リスト
- LWIRPOSE: A novel LWIR Thermal Image Dataset and Benchmark [9.679771580702258]
このデータセットは、2400以上の高品質なLWIR(熱)画像で構成されている。
それぞれの画像には2Dの人間のポーズが刻まれており、研究者や実践者にとって貴重なリソースとなっている。
我々は、その可能性を示すために、データセットの最先端ポーズ推定手法をベンチマークする。
論文 参考訳(メタデータ) (2024-04-16T01:49:35Z) - LiCamPose: Combining Multi-View LiDAR and RGB Cameras for Robust Single-frame 3D Human Pose Estimation [31.651300414497822]
LiCamPoseは、マルチビューRGBとスパースポイントクラウド情報を統合して、単一のフレームで堅牢な3Dポーズを推定するパイプラインである。
LiCamPoseは、2つの公開データセット、1つの合成データセット、1つの挑戦的な自己収集データセットを含む4つのデータセットで評価されている。
論文 参考訳(メタデータ) (2023-12-11T14:30:11Z) - UniHPE: Towards Unified Human Pose Estimation via Contrastive Learning [29.037799937729687]
2次元と3次元の人間の姿勢推定(HPE)はコンピュータビジョンにおける2つの重要な知覚的タスクである。
提案するUniHPEは,3つのモードの全ての特徴を整列する,統一されたヒューマンポーズ推定パイプラインである。
提案手法は,コンピュータビジョンの分野を前進させ,様々な応用に寄与する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-24T21:55:34Z) - Under the Cover Infant Pose Estimation using Multimodal Data [0.0]
対象児のポーズ推定のための新しいデータセットMannequin Lying pose (SMaL) を提案する。
我々は,技量推定の訓練により,全身のポーズを表紙下で推測することに成功した。
最高性能モデルでは,25mm 86%以内で関節を検出でき,全体の平均誤差は16.9mmであった。
論文 参考訳(メタデータ) (2022-10-03T00:34:45Z) - Towards Accurate Cross-Domain In-Bed Human Pose Estimation [3.685548851716087]
長波長赤外(LWIR)変調に基づくポーズ推定アルゴリズムは、上記の課題を克服する。
そこで本研究では,ドメイン間差を低減するために,2次元データ拡張による新たな学習戦略を提案する。
実験と分析により,複数の標準人のポーズ推定基準に対するアプローチの有効性が示された。
論文 参考訳(メタデータ) (2021-10-07T15:54:46Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。