論文の概要: Towards Accurate Cross-Domain In-Bed Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2110.03578v1
- Date: Thu, 7 Oct 2021 15:54:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 15:39:39.237363
- Title: Towards Accurate Cross-Domain In-Bed Human Pose Estimation
- Title(参考訳): ベッド内人物ポーズ推定の高精度化に向けて
- Authors: Mohamed Afham, Udith Haputhanthri, Jathurshan Pradeepkumar, Mithunjha
Anandakumar, Ashwin De Silva, Chamira Edussooriya
- Abstract要約: 長波長赤外(LWIR)変調に基づくポーズ推定アルゴリズムは、上記の課題を克服する。
そこで本研究では,ドメイン間差を低減するために,2次元データ拡張による新たな学習戦略を提案する。
実験と分析により,複数の標準人のポーズ推定基準に対するアプローチの有効性が示された。
- 参考スコア(独自算出の注目度): 3.685548851716087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human behavioral monitoring during sleep is essential for various medical
applications. Majority of the contactless human pose estimation algorithms are
based on RGB modality, causing ineffectiveness in in-bed pose estimation due to
occlusions by blankets and varying illumination conditions. Long-wavelength
infrared (LWIR) modality based pose estimation algorithms overcome the
aforementioned challenges; however, ground truth pose generations by a human
annotator under such conditions are not feasible. A feasible solution to
address this issue is to transfer the knowledge learned from images with pose
labels and no occlusions, and adapt it towards real world conditions
(occlusions due to blankets). In this paper, we propose a novel learning
strategy comprises of two-fold data augmentation to reduce the cross-domain
discrepancy and knowledge distillation to learn the distribution of unlabeled
images in real world conditions. Our experiments and analysis show the
effectiveness of our approach over multiple standard human pose estimation
baselines.
- Abstract(参考訳): 睡眠中の人間の行動モニタリングは様々な医学的応用に不可欠である。
接触型ポーズ推定アルゴリズムの大部分はrgbモダリティに基づいており、毛布による咬合や照明条件の変化などによるベッド内ポーズ推定に効果がない。
長波長赤外(LWIR)変調を用いたポーズ推定アルゴリズムは上記の課題を克服するが、そのような条件下で人間アノテータが生成する基底真理は実現不可能である。
この問題に対処するための実現可能な解決策は、画像から学んだ知識をポーズラベル付きでオクルージョンなしに移し、現実の状況(毛布による閉塞)に適応させることである。
本稿では,実環境におけるラベルなし画像の分布を学習するために,クロスドメイン不一致と知識蒸留を低減させる2次元データ拡張を含む新しい学習戦略を提案する。
実験と分析により,複数基準の人格推定ベースラインに対するアプローチの有効性が示された。
関連論文リスト
- In-Bed Pose Estimation: A Review [8.707107668375906]
ベッド内ポーズ推定は、患者の睡眠行動を監視し、潜在的な疾患の診断のために早期に症状を検出するために用いられる。
いくつかの研究は、ベッド内の人間のポーズを推定するために、一様および多様の手法を利用している。
本研究の目的は,従来の研究の限界,現状の課題,そしてベッド内人間のポーズ推定分野における今後の研究に対する洞察を提供することである。
論文 参考訳(メタデータ) (2024-02-01T15:57:11Z) - Unsupervised Domain Adaptation for Low-dose CT Reconstruction via Bayesian Uncertainty Alignment [32.632944734192435]
低線量CT(LDCT)画像再構成技術は、許容画質を維持しつつ、患者の放射線被曝を減らすことができる。
この問題ではディープラーニングが広く用いられているが、臨床シナリオではデータテストのパフォーマンスが劣化することが多い。
LDCT再構成の教師なし領域適応(UDA)は分布アライメントによってこの問題を解決するために提案されている。
論文 参考訳(メタデータ) (2023-02-26T07:10:09Z) - Anatomy-guided domain adaptation for 3D in-bed human pose estimation [62.3463429269385]
3次元人間のポーズ推定は臨床モニタリングシステムにおいて重要な要素である。
ラベル付きソースからシフトしたラベル付きターゲットドメインにモデルを適応させる新しいドメイン適応方式を提案する。
我々の手法は、様々な最先端のドメイン適応法より一貫して優れています。
論文 参考訳(メタデータ) (2022-11-22T11:34:51Z) - Aligning Silhouette Topology for Self-Adaptive 3D Human Pose Recovery [70.66865453410958]
アーティキュレーション中心の2D/3Dポーズ監視は、既存の多くの人間のポーズ推定技術においてコアトレーニング目標を形成する。
本稿では,ソース学習モデルベース回帰器を適応させるために,シルエット監視のみに依存する新しいフレームワークを提案する。
我々は、トポロジカル・スケルトン表現を生シルエットから切り離すために、一連の畳み込みに優しい空間変換を開発する。
論文 参考訳(メタデータ) (2022-04-04T06:58:15Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Privacy-Preserving In-Bed Pose Monitoring: A Fusion and Reconstruction
Study [9.474452908573111]
ベッド内ポーズ推定における複数の非視覚的・プライバシー保護的モダリティの画像の有効利用について検討する。
まず,様々な画像モダリティからの情報を効果的に融合し,より優れたポーズ推定を行う。
次に,可視画像が利用できない場合のベッド内ポーズ推定を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-22T07:24:21Z) - Single Image Human Proxemics Estimation for Visual Social Distancing [37.84559773949066]
シーングラウンドと画像平面のホモグラフィ行列を近似する半自動解を提案する。
次に、オフザシェルフポーズ検出装置を利用して、画像上の身体のポーズを検出し、対人距離を判断する。
論文 参考訳(メタデータ) (2020-11-03T21:49:13Z) - Simultaneously-Collected Multimodal Lying Pose Dataset: Towards In-Bed
Human Pose Monitoring under Adverse Vision Conditions [15.12849597272402]
ベッド内の人間のポーズ推定は多くの医療応用において重要な価値を持っている。
本稿では,同時コンパイル型マルチモーダルLying Poseデータセットについて紹介する。
現状の2Dポーズ推定モデルは,PCKh@0.5において最大95%の性能を期待できるSLPデータを用いて,単一モードで効果的に訓練できることを示す。
論文 参考訳(メタデータ) (2020-08-20T02:20:35Z) - Appearance Consensus Driven Self-Supervised Human Mesh Recovery [67.20942777949793]
単眼画像から人間のポーズや形状を推定する自己教師付きメッシュ回復フレームワークを提案する。
標準モデルに基づく3次元ポーズ推定ベンチマークの最先端結果を得る。
その結果、色付きメッシュ予測により、ポーズや形状推定以外にも、さまざまな外観関連タスクにフレームワークの使用が開放される。
論文 参考訳(メタデータ) (2020-08-04T05:40:39Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。